


(日 ) 高 桥 信 / 著 
(B) 株式 会 社 TREND-PRO/ 漫 画 制 作 
陈 刚 / 译 


BK BE SS OS 3 IE 





[日 ] 高 桥 信 著 
[ 日 ] 株式 会 社 TREND-PRO ”漫画 制作 
陈 刚 译 








eH Re 


序 章 CARMHRHS 


第 1 章 确认 数据 种 类 
分 类 数据 和 数 佬 数据 





第 2 章 掌握 数据 整体 的 状态 ( 数值 数据 篇 ) 
eC ae 














第 5 章 求 机 率 81 
ne BA MRM access 333 





第 7 章 深入 理解 独立 性 检验 143 





Ge iv D 


Ge v 


卡 方 分 布 的 横 轴 刻度 


D 





213 








a 
Q 


SAEZ Ss 























我 回来 了 ! 
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不 好 意思 ， 打 扰 了 。 
这 是 我 们 的 公司 的 同事 
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具体 来 说 ， 就 是 利用 统计 学 
知识 来 做 市 场 调查 


你 还 在 上 高 中 ， 即 便 我 这 么 
说 ， 我 起 你 应 该 还 是 不 知道 
什么 是 "营销 "， 对 吧 ! 


真是 好 直接 啊 ! 


大 概 不 是 很 清楚 吧 ? 了 所 谓 的 
统计 学 ， 粗 略 来 说 ， 就 是 从 
样本 反应 出 的 信息 中 推测 总 
体 状况 的 学 问 。 


正好 今天 的 晚报 有 
HRA RH 
内 容 呢 ! 
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“根据 朝 每 晚报 的 调查 结果 
内 阅 支 持 率 为 39%。” 


是 的 ， 此 处 就 应 用 了 琉 衣 ， 日 本 大 约 有 多 
统计 学 知识 哟 ! 少 人 有 投票 权 呢 了 


4! 
明明 你 们 都 没有 直接 接受 
调查 ， 但 朝 每 晚报 却 还 能 
Sek SR? 
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不 过 ， 要 对 数量 如 此 庞大 
的 人 群 进行 调 查 那 难度 可 


没 错 。 因 此 ， 我 们 若 对 所 有 
具备 投票 权 的 人 进行 调查 并 


算出 支持 率 ， 那 么 ， 这 个 结 
果 肯 定 非常 准确 ， 这 不 会 有 
任何 疑问 吧 ? 





所 以 才 会 限定 人 数 
来 进行 调查 。 


EEL RE 
琉 衣 ， 统 计 学 上 ， 将 应 做 为 真正 调查 对 象 的 REA ARR | 
集合 称 为 “总 体 '”， 而 由 总 体 中 取出 的 部 分 
个 休 所 组 成 的 集合 则 称 为 “样本 2” 。 





上 1 总体: Population, 2. 样本: Samples 
序章 ” 令 人 性 动 的 统计 学 


总 之 ， 以 内 阁 支 持 率 为 例 ， 总 体 即 为 
“所 有 具有 投票 权 的 人 ”。 


而 这 个 调查 似乎 是 以 2000 人 为 询问 
对 象 ， 因 此 ， 这 2000 人 即 为 样本 。 





— 当然 希 然而 ， 这 在 现实 中 是 不 可 就 算 无 法 进行 精细 的 
望 调查 总 体 能 的 ， 真 是 令 人 困惑 呀 ! 调查 ， 难 道 没 办 法 尽 
可 能 准确 地 得 知 总 体 


题 的 最 佳 方法 就 是 
Rit FH | 


A! 





























要 怎么 做 才能 跟 五 十 岗 先 生 


更 亲近 些 呢 ? 
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— 
SF Wa 


将 的 


a! 
东区 的 同事 也 可 以 

! 

— NOY, 比如 五 十 诚 先生 
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山本 老师 ， an - 
从 什么 地 方 开始 4 


RAR, RAK EK 
学 园 物 语 " 吗 ? 
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x) a 
不 过 这 和 统计 学 有 什么 
关系 呢 ? 


中 要 









密 瓜 学 园 物语 第 五 集 女 
爱 读者 问卷 


QRA GANZER WERA 
什么 了 
1 AP i 
2. iE 
3. 一 般 
4. 有 点 无 种 
5. 非 常 无 种 


Qz. 你 的 性 别 是 ?了 
E > 2 


Q3 .你 的 年 龄 是 ? 
Qu. 平 均 每 月 购买 几 本 杂志 了 7 


我 们 将 从 回 函 中 
抽取 30 名 幸运 读 
者 ， 并 赠送 “ 莉 


感 淆 您 的 协助 。 您 的 宝贵 意见 ， 将 是 我 们 今后 
出 版 和 策 刘 的 重要 参考 。 









等 出 这 个 问卷 
if 


(RP R) THAR 
(KER) HARM | 
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从 读者 处 获得 的 数据 





Q2 
ERI 


Q3 





A 
B 
C 
D 
€ 
E 
G 
H 
I 








dowd towed wed dt 








ww OO NF WE NW = N 








以 这 份 问卷 来 说 ， 友 哈 密友 学 园 物语 第 五 集 妇 
就 是 这 种 情况 。 爱 读 者 问 4 


ORE CEOS RHE BERHREN? 
1. 非 党 有 种 
2. 有 点 有 十 


不 可 测量 的 数据 
SFREE 


1. 女 


03. 你 的 年 龄 为 了 7# 


可 测量 的 数据 


04, EAE AMA LIRR? _2 本 


AARAM, 您 的 宝 合意 多， 将 作为 我 们 今后 
出 版 和 策划 的 重要 HR, 


不 可 测量 的 数据 称 为 “分 类 数据 ?”， 
而 可 测量 的 数据 称 为 “数值 数据 2” 





A 
1. 分 类 数据 : Category Data 或 Categorical Data. 2. 数值 数据 





O1.BERRDR 

数据 咋 。 

\ ae 
| q 


BMRA, "OLE | IRI ; 
HEE RATE GR || hi Ap 
” MW EA 
| T Sie 
i eS NE 


— A 


因为 它 的 数值 数 
据 之 间 并 非 相等 
间隔 。 
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I 






























































由 于 这 个 尺子 以 1 厘米 为 测量 刻 
度 ， 因 此 ，151 厘 米 的 上 一 个 刘 
度 就 是 152 厘 米 ， 再 往 上 也 是 等 
#153, 1548x 


每 一 个 刻度 和 相 邻 的 刻度 之 间 的 
间隔 都 是 相等 的 。 








那么 英 检 的 级 数 是 算 
哪 一 类 数据 呢 ? 


英 检 难 易 度 的 基准 
2 级 3 级 ”| ”4 级 5 级 











大 学 高 中 中 学 中 学 中 学 
高 级 程度 毕业 程度 毕业 程度 中 级 程度 初级 程度 
约 


(o MRE: oeo) (., 100 单 词 量 (, 100 单 词 量 1, 300 单 词 量 600 单 词 量 











(摘自 财团 法 人 日 本 英语 考试 协会 http://www.cilken.orjp ) 


依 级 别 不 同 ， 所 应 掌握 的 
具体 的 单词 量 差 很 多 呢 ! 


除了 单词 量 ， 其 他 部 分 的 
难 易 程度 也 有 差异 呢 ! 
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||) 美 检 的 等 级 是 "不 可 测量 "的 
数据 ， 也 就 是 分 类 数据 | 
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Q2. —* 出 是 > 
Ow 








这 份 读者 问卷 的 O1 中 ， 每 
个 选项 间 的 间隔 相等 吗 ? 









Q3. RSE ye 
—— GLES 
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Atit! 


不 过 统计 学 比 预料 
中 更 贴近 生活 ， 也 
很 有 趣 呢 | 
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83. 实务 中 “非常 有 趣 ” 一 “非常 无 趣 ” 的 运用 灾 


正如 25 页 中 所 述 ，“Q1. 读 完 ' 哈 密 瓜 学 园 物语 第 五 集 的 感觉 为 …… 是 分 类 数据 。 
然而 ， 实 际 的 消费 者 问卷 调查 中 ， 数 值 数据 并 不 少见 。 也 就 是 


























非常 有 趣 二 -2 

有 点 有 趣 = 4 分 

一 般 = 3 分 

有 点 无 趣 = 2 分 

非常 无 趣 => IgE S| 

或 是 

FHAR —— IE 

有 点 有 趣 = 1 分 
i. sae => aa 

有 点 无 起 = E 

非常 无 趣 => L -分 | 

以 这 种 方法 解释 数据 的 情况 并 不 少见 。 


理论 的 世界 和 实际 的 世界 ， 不 ， 客 套话 的 世界 和 真心 话 的 世界 也 应 该 存在 这 样 
的 区 别 。 无 论 如 何 ， 和 希望 各 位 知道 ， 若 观点 不 同 ， 则 数据 的 获得 方式 也 有 可 能 会 不 
同 。 
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请 将 “血型 "、“ 对 运动 饮料 X 的 评价 "、“ 开 空调 令 人 感到 舒适 的 室温 "、 
“100 米 的 短跑 成 绩 " 分 为 分 类 数据 或 数值 数据 。 





a 
1 例题 
a 
请 注意 下 表 : 
I 
> 开 空调 令 人 感 的 短跑 成 

和 对 运动 饮料 X 的 ` 全 浊 | 100 米 的 短跑 成 
' aa ee | URE) kie) 
Li 
i Bk A iat 2 122 

B F 喝 2 
J a AB 好 喝 25 17.0 
1 DI o 普通 27 15.6 
1 EI A 难 喝 24 18.4 
' A i : 3 
: 
Li 
' 
LI 
' 
. 





“血型 "和 “对 运动 饮料 X 的 评价 "为 分 类 数据 。* 开 空调 令 人 感到 舒适 的 室 
温 " 和 “100 米 的 短跑 成 绩 "为 数值 数据 。 


e2 

。 数 据 可 分 为 分 类 数据 和 数值 数据 。 

。 "非常 有 趣 "~" 非 常 无 趣 "等 ， 在 理论 上 为 分 类 数据 。 然 而 ， 在 实务 上 ， 却 经 常 
将 其 视 为 数值 数据 。 
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掌握 数据 整体 的 状态 
( 数值 数据 篇 ) 























GE IRL S 


我 超 想 吃 呀 | 

看 了 这 本 杂志 ， 不 知 
道 该 选 哪 家 ， 好 难 选 
R! 


— 


€ 
0 


> 
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“REUNPSH M50 ”上 刊载 的 拉面 馆 的 拉面 价格 
价格 〈 日 元 ) 价格 〈 日 元 ) 

ETLI 700 ET IEJ 780 
2 50 27 540 

3 600 a éso 

4 éso 29 sto 

5 Ro 30 750 

6 750 n £00 

7 500 32 550 

有 £30 33 750 

9 Elo 3 700 

10 700 35 600 

“n 230 36 Zoo 

12 720 37 Zoo 

13 6ko 3 eo 

14 650 39 740 

15 740 w 740 


7o 
600 
670 
6go 
éso mI gea 
£30 


£ 














VLERARRRER 








* 
— 


— — 


即使 你 这 样 问 ， 我 
也 回答 不 出 来 …… 
) 


a 
5 
o 30 
? 7 
a 
9 
/0 * 
t 
| 12 2 
要 怎样 才能 让 这 个 
表格 变 得 更 容易 理 
MR? Stk 
—* R 


|/ 9 
Q 
Na N 
N 按 某 一 标准 重新 | 医 
整理 一 下 吧 / 
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光 看 数字 的 排列 ， 肯 定 
无 法 了 解 更 多 信息 。 


为 了 方便 整理 ， 首 先 ， 以 价格 
理 ! 


汪汪 | 为 标准 进行 可 









想象 一 下 ， 一 家 集结 
了 50 家 拉面 馆 的 百货 公 
ave! 




















层 5 
: ral 
elsb ll 
a ET 
回国 5 




















每 层 楼 都 挂 一 块 看 
板 ， 显 示 该 楼 层 的 
中 间 价 格 。 











因为 2 楼 是 600~700 日 元 ， 
所 以 标 着 650 日 元 。 


因为 这 家 百货 公司 以 价格 
范围 来 分 楼 层 ， 因 此 每 层 
的 店铺 都 不 一 样 哆 | 


每 层 楼 的 店铺 数 则 
ARB. 





1. 组 中 值 ;: Class Midpoint, 2. 次 数 : Frequency, 3. 相对 次 数 :Relative Frequency. 
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百分比 一 样 i 4 fi) 
* 
“vf 


_ 所属 各 组 的 数据 个 数 
BBR 











a 

3 楼 有 18 家 店铺 ， 总 共有 2 ! 
SOR, MU 属于 700~800 日 元 的 这 组 ， 也 就 是 组 中 
值 为 750 日 元 的 拉面 馆 ， 其 相对 次 数 为 
0.36， 床 以 100 后 ， 以 百分比 来 表示 ， 
就 是 36%。 


18 _ 36 _ 
30109 236%! 
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SHAM ALES 
的 内 容 整 理 成 如 图 





确实 ， 只 有 数字 的 话 会 
比较 难以 理解 ， 那 就 将 
它 图 表 化 吧 | 





也 叫 柱状 图 ， 是 一 种 统计 
报告 图 ， 由 一 系列 高 度 不 
等 的 纵向 条 纹 表 示 数 据 分 
布 的 情况 。 





1. 次 数 分 布 表 : Frequency Distribution Talbe。 2. 直方 图 : Histogram. 
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Bie EE”, RY 
话说 ， 在 此 即 为 拉面 
的 价格 


长 条 的 宽度 即 为 
“mE” 


长 条 的 中 央 即 为 
“组 中 值 " 





“RP Dew aso” WR 
分 布 表 和 制 成 的 直方 图 


直方 图 (APAR 


Talal 


BAB (Aw AER) 


ra 


550 650 750 850 


在 上 图 为 "次 数 ， 


在 下 图 则 为 "相对 
KK", 





你 说 的 “似乎 ”就 
是 重点 ! 

次 数 分 布 表 和 直方 
图 ， 就 是 为 了 让 人 
能 够 直观 地 掌握 全 
体 数 据 的 状态 ， 而 
设计 出 来 的 ! 


我 似乎 或 多 或 少 
可 以 想象 了 。 


前 一 阵子 我 们 全 班 的 
女生 一 起 去 打 保龄球 
(bowling) 了 ! 


有 高 中 女生 会 做 
这 种 事 吗 ? SAR, MBA 


不 是 很 多 呀 | 


是 呀 ， 总 共有 18 人 ， 
所 以 每 6 人 一 组 ， 分 
成 3 组 做 对 抗 赛 哎 | 








乍 看 之 下 ， 琉 衣 的 得 分 


这 边 的 “ 琉 衣 琉 衣 " 指 的 是 
— HT] 


—— 


Jedz BIRRE TASET 
Ey 


Ea 


FoR HAAS HI He 
所 谓 的 平均 分 就 是 各 队 平均 数 更 高 的 分 


每 个 人 的 大 概 得 分 ， 就 是 全 队 总 分 平均 || 数 的 话 ， 要 请 我 
站 人 te 后 的 分 数 ， 对 吧 ? 





刚才 说 明 的 "平均 数 "， 其 实 严格 me 
‘ — — fi 其 他 还 有 “几何 平均 ?及 “调和 
ee ARTON 平均 数 *3" 等 平均 数 
现在 先 别 管 算 法 ， 先 把 名 称 记 下 
RO! 


1. RARER Arith 











我 们 再 来 看 一 次 
得 分 表 。 





2 3. 中 位 数 客 








el Palas : 7 被 视 为 "每 个 人 的 
B 队 ， 你 不 觉 | ra 4 大 概 得 分 "， 很 没 
x A 道理 吗 ? 


没 错 。 得 分 只 有 2 位 数 的 与 其 求 平均 数 ， 不 


成 员 明明 有 5 人 之 多 ， 平 时 如 找 出 "中 位 数 "" 
均 数 却 超过 100. 较为 妥当 。 
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首先 ， 将 各 队 得 分 依 大 小 


所 谓 的 中 位 数 ， 是 顺序 排列 看 看 。 
指 将 数据 依 大 小 顺 

序 排列 时 ， 最 中 间 

的 值 。 


BBA TRA BR Les 
0414 -390 C87) bat 723) || Wrotet 


BAB ——— 


Brae Gae RJA w3 


PROT AOA A Hak 


BAAR A, ME 。 但 若 如 同 本 次 的 保龄球 大 赛 一 

中 间 的 数据 即 为 中 位 数 。 Ki, BAHAR AR, OH 
第 三 和 第 四 顺 位 的 数字 之 平均 是 了 88 = 
就 成 为 中 位 数 。 $ 





再 来 介绍 一 个 和 平均 数 

有 关 的 小 知识 大 智慧 是 由 小 知识 聚 
EaR, AR, ik 
有 存 钱 的 习惯 吗 ? 


那么 ， 经 常 在 报纸 或 电视 新 闻 
中 出 现 的 “日 本 平均 * 储 匣 额 "的 
数值 ， 你 没有 对 此 数值 之 高 感 


原来 除了 
这 么 有 钱 
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那个 数字 是 被 少数 的 超级 大 y 
富 箱 抬 高 的 。 


VE 















































在 这 种 情况 下 ， 也 许 求 中 位 
数 较 能 符合 一 般 民 众 的 平均 


ft EH 


Ast, PRAT HEM 
比 "平均 " 值 低 相 当 多 ， 也 
不 必 因 此 感到 担忧 。 





ye! 
那 就 和 比 中 位 数 高 出 
许多 的 富 箱 结婚 吧 | 





47 
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PH 
H W 487, 
+ + > 
0 5D 100 


但 这 两 队 的 状况 大 
不 相同 吧 ? 
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像 这 样 为 了 表现 离散 


是 呀 ，4 队 队员 的 得 分 程度 "所 使 用 概念 的 就 


散落 在 高 点 和 低 点 ， 
但 B 队 全 体 队员 的 分 数 
都 相当 接近 。 


kam 


标准 差 最 小 值 为 0， 而 数据 的 “离散 程度 " 越 大 ， 
标准 差 的 值 就 越 大 。 


0 最 小 


RoR mie 
C2 nis med) 





.标准 差 : Standard Deviations 


只 要 在 这 里 填 入 具体 的 
AIRES! (86-8 N (13-30 (124-8 D4 111-97) (90~87) 438-97)" 
Do — 


a | (01937742474 37+ (- 49)" 
来 ， 我 们 一 起 算 算 看 吧 ! * — 6 aL eee 


= [A196 + (369+576+9+ 240| 
6 


那么 B 队 就 由 你 来 
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B4-B TTB 03-SY+ C5-81 Qo P+ (A -8 
6 


= [ESCE C24 3t 27 
6 


= /A+2564 2564 44944 
6 


答对 了 ! 


你 也 可 以 做 
得 到 只 | 


大 队 =27.5 BR=9.5 


大 家 得 分 都 差不多 的 B 队 ， 
标准 差 确实 比较 小 耶 | 





标准 差 的 算式 是 





(每 一 数据 -平均 数 ) 的 总 和 





A: 


但 也 有 人 认为 应 当 是 


数据 的 个 数 





(每 一 数据 -平均 数 ) 汐 总 和 





v. 


数据 的 个 数 -1 





总 体 是 真正 想 调查 的 


对 象 的 集合 ， 
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把 数据 的 个 数 减 掉 
一 个 ! 
P 
a 
| O, 0 
— 
RF! 


求 样本 的 标准 差 就 用 后 面 的 
公式 


而 样本 是 从 总 体 中 被 
选 出 来 的 人 所 形成 的 
合 


集合 。 























没 错 。 

如 果 可 以 像 琉 衣 的 保龄球 队 
一 样 ， 获 得 整个 全 合 的 数据 
或 好 了 。 


所 以 大 部 分 部 是 使 用 
后 面 的 公式 。 








8 5. 次 数 分 布 表 的 组 距 窜 


至 此 ， 也 许 有 些 人 仍然 无 法 完全 理解 “1. 次 数 分 布 表 和 直方 图 ”， 我 们 就 再 做 一 
些 详细 的 说 明 吧 。 
下 表 同 第 38 页 的 曾 使 用 过 的 表 。 


令 表 2.1“ 美 味 拉面 畅销 前 50” 的 次 数 分 布 表 











如 各 位 所 见 ， 上 表 中 的 组 距 是 100。 之 所 以 先 择 100， 并 没有 什么 数学 上 的 规 
定 ， 而 是 全 由 山本 老师 主观 决定 的 。 没 错 ， 组 距 该 设 多 少 ， 完 全 依照 分 析 者 本 身 的 
判断 。 

“以 主观 设 定 的 组 距 而 做 成 的 次 数 分 布 表 并 没有 说 服 力 ， 无 法 在 他 人 面前 公 
开 ， 难 道 就 没有 按 数 学 原理 制定 组 距 的 方法 吗 ? ”也 许 有 人 会 产生 这 样 的 疑问 。 事 
实 上 ， 方 法 是 有 的 。 步 又 如 下 页 所 述 。 既 然 已 经 有 数据 了 ， 就 让 我 们 来 看 看 ， 如 果 
以 表 2.1 来 试 算 会 产生 什么 样 的 结果 。 
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组 ”的 个 数 即 组 数 可 以 使 用 史 特 吉 斯 公式 进行 计算 ， 即 : 
— log,。 数 据 的 个 数 
log? 
求 出 。 
log,,50 
1+ ——— =1+45.6438---=6.6438---=7 
log,.2 
组 距 以 
(数据 的 最 大 值 ) 一 (数据 的 最 小 值 ) 
用 史 特 吉 斯 公式 求 出 的 组 数 
求 出 。 
980—500 _ 480 
— — =68.5714---~69 
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以 步 又 2? 求 出 的 组 距 为 基础 ， 做 出 如 下 的 次 数 分 布 表 。 
R22 “美味 拉面 畅销 前 50” 的 次 数 分 布 表 ( “组 距 ” 以 公式 求 出 ) 








500~569 
569~638 
638~707 
707~776 
776~845 
845~914 
914~983 
合计 

结果 如 何 ? 各 位 不 觉得 这 样 反而 做 出 了 一 张 比 表 2.1 还 令 人 无 法 理解 的 表格 吗 ? 
也 就 是 说 ， 难 道 各 位 不 会 抱 着 “为 何以 69 元 为 组 距 呢 ? ”的 疑问 吗 ? 然后 ， 即 使 你 
努力 地 说 明 : “这 是 使 用 史 特 吉 斯 公式 求 出 的 ……” 你 不 觉得 还 是 会 被 质问 : “ 谁 
知道 史 特 吉 斯 公式 是 什么 呀 ! 到 底 为 什么 要 采用 这 么 难以 解释 的 组 距 呢 ? ” 

总 而 言 之 ， 也许 有 人 会 质疑 以 主观 设 定 组 距 的 合理 性 。 但 另 一 方面 ,我 们 从 上 
表 可 以 清楚 得 知 ， 即 使 用 数学 方法 设 定 组 距 ， 却 时 常 还 是 会 产生 不 尽 理想 的 结果 。 
因此 ， 这 个 方法 是 否 恰 当 ， 须 重新 思考 。 但 是 ， 我 个 人 觉得 原先 的 次 数 分 布 表 就 是 
用 来 掌握 数据 整体 的 “气氛 ”， 因 此 ， 以 分 析 者 可 接受 的 组 距 来 处 理 即 可 。 










0.30 
0.12 
0.20 
0.20 
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[e 6. 推断 统计 学 和 描述 统计 学 客 





在 序章 中 ， 有 这 样 一 段 解说 : “所 谓 的 统计 学 ， 即 为 从 样本 的 信息 推测 总 体 状 
况 的 学 问 。” 其 实 这 段 解说 并 不 恰当 

统计 学 可 分 为 推断 统计 学 和 描述 统计 学 两 类 。 序 章 所 解说 的 为 前 者 。 那 么 ， 后 
者 的 描述 统计 学 到 底 是 什么 呢 ? 也 就 是 借 由 整理 资料 ， 尽 可 能 简单 明了 地 显示 出 整 
体 状 况 为 目的 的 统计 学 。 即 ， 将 对 象 集合 视 为 一 个 总 体 的 统计 学 。 

描述 统计 学 的 解说 可 能 由 于 过 于 抽象 而 让 人 难以 理解 。 让 我 再 举 个 例子 说 明 。 
刚才 山本 求 出 了 琉 衣 队 得 分 的 平均 数 和 标准 差 。 他 求 出 此 两 者 的 目的 ， 并 非 为 了 推 
测 总 体 的 状况 。 以 琉 衣 队 为 样本 的 总 体 ， 究 竟 是 怎样 的 总 体 呢 ? 简 而 言 之 ， 山 本 之 
所 以 求 出 平均 数 和 标准 差 ， 仅 仅 是 为 了 简洁 地 表示 琉 衣 队 的 状况 。 这 样 的 统计 学 即 
为 描述 统计 学 











例题 





(1 ) 请 求 出 平均 数 
(2 ) 请 求 出 中 位 数 。 
(3 ) 请 求 出 标准 差 
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16.3 +22.4 +18.5 +18.7 +20.1 _ 96 _ 


(1) 平均 数 是 5 5 





(2) 中 位 数 是 18.7 


[163 185 (187) 20.1 224 


(3 ) 标准 差 是 











(16.3—19.2) +(22.4-19.2} +(18,5—19.2) +(18.7— 19.2)? +(20.1-19.2) 











ran / 2.9} + 3.2 +0. +00.5} + 0.9 
g 5 








= / $4! +10.24+0.49 + 0.25 + 0.81 
* 5 


” 
1 
1 
1 
1 
1 
1 
r 
1 
1 
1 
a 
a 
1 
1 
' 
1 
1 5 
' 
' 
1 
' 
' 
a 
a 
i 
a 
1 
1 
a 
1 
1 
. 


* 利 用 “直觉 ”掌握 整体 数据 的 “氛围 ”的 方法 有 : 次 数 分 布 表 及 直方 图 。 

。 设 定 次 数 分 布 表 的 组 距 可 采用 史 特 吉 斯 公式 。 

。 用 数学 原理 掌握 全 体 资 料 “ 氛 围 ” 的 方法 有 ， 算 术 平 均 数 、 中 位 数 和 标准 差 。 
。 当 存在 过 大 或 过 小 的 数据 时 ， 中 位 数 较 平均 数 更 能 正确 掌握 数据 状态 。 

。 标 准 差 为 表示 数据 “离散 程度 ”的 指标 。 
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掌握 数据 整体 的 状态 
( 分 类 数据 篇 ) 




























































































© 
Cg e 
e 2 
e e RAAB 
e? 水 手 服 啊 …… 
@ 
\ 还 真 少见 | 
Co ORKO TT T 
(0 
Se 我 们 亚 上 还 做 了 
e ok 问卷 调查 呢 ! 
e° 看 …'… 吉 是 这 件 。Q7 
@ 
新 校 腿 问 着 调查 
结果 就 是 这 样 。 














aH! 
因为 “喜欢 ”和 “ 讨 
厌 ” 是 不 可 测量 的 数 





+È! 
这 份 问卷 就 是 分 类 


61 


那么 ， 为 了 掌握 整体 数据 
的 情况 ， 我 们 先 来 做 一 张 
















py 


— V—— 
PR | | 人 D (| 
p wl f, ) 








我 将 这 张 表 称 为 
Jon “次 数 分 布 表 ”。 


L 


— (> 
因此 ， 比 例会 变 成 这 样 。 
人 Y 


y Nö 
( NW 


d 
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新 校服 如 何 ? 




















为 了 便于 你 的 理解 ， 我 们 来 


做 成 图 表 形式 吧 ! 


列 出 图 表 后 ， 回 答 “喜欢 ”的 
人 超过 半数 ， 因 此 这 款 校服 的 
设计 似乎 还 变 讨 人 喜欢 的 。 


补充 一 下 ， 我 也 迭 
“喜欢 ”的 。 


























如 果 是 图 表 的 
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例题 
某 家 报社 对 有 意 执掌 下 届 政 权 的 AA 党 ， 做 了 份 问卷 调查 表 。 结 果 如 下 表 
| 所 示 。 
相 较 于 OO 党 ， 
| AA 党 …… 
' 回答 者 1 不 值得 期 竺 
i 回答 者 2 不 值得 期 竺 
i 回答 者 3 不 值得 期 竺 
回答 者 4 没 意 见 
5 回答 者 5 值得 期 待 
1 回答 者 6 不 值得 期 竺 
回答 者 7 值得 期 竺 
í 回答 者 8 没 意 见 
回答 者 9 得 期 竺 
b 回答 者 10 不 值得 期 竺 
= 请 将 此 问卷 调查 表 结 果 做 成 “次 数 分 布 表 ” 
i 
L 
' 
A 
1 
: 值得 期 竺 
1 没意思 2 20 
不 值得 期 待 6 60 
合计 10 100 





“做 成 “次 数 分 布 表 ” 为 掌握 数据 整体 状态 的 方法 之 一 
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标准 计 分 和 离 差 




























ARN E ae ear | 
今天 我 和 我 的 朋友 由 美 一 起 在 
| | 外 面 上 课 。 
= T 
y * > 

















8 






A 
— W 
Atk! ¢ 
打扰 你 们 M 
了 心心 人 | 
ggg 
J) 
Ati td b 4 
我 们 不 但 感情 好 ， 而 且 
不 同 科目 的 考试 还 同 分 
%! \\ 
人 从 
* | 


66 ”第 4 章 标准 计 分 和 离 差 


但 为 什么 由 美的 古文 成 绩 的 
离 差 比较 高 呢 ? 























这 是 因为 英语 和 古文 
的 分 数 价值 不 同 。 


WO 2a Aa TE 
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81.3 90 [00 

i— (5.7 — 94 
PHRA — a A k 
英语 = 81.3 74.3 90 100 
古文 = 76.3 | 





如 此 一 来 ， 就 可 以 知 
道 就 算 同 样 考 90 分 ， 
但 各 自 的 “含金量 ” 
是 不 同 的 了 吧 ! 


那么 ， 待 会 就 请 你 f 
MBAR! /| 
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和 生物 的 平均 
是 53 分 叭 ! 


但 是 为 什么 离 差 还 是 
不 一 样 呢 ! 


明明 和 平均 数 的 DRY 
距离 相同 呀 ! ! 
es 你 是 指数 据 的 


少 呢 ? “离散 程度 ” 


Oey Ay 





1. 标准 差 : Standard deviation, 
69 


标准 差 越 小 ， 代 表 这 组 数据 的 
“离散 程度 ”也 越 小 


所 以 比 起 历史 ， 大 家 的 生物 课 


成 绩 较 为 接近 。 
| 


Ald: V Dama 
从 考试 的 角度 来 说 ， —— 
就 是 生物 的 1 分 比较 ws. 


ka 
ee is 
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A 
* 
R 
x 
R 
* 
cf 
x 
È 


件 事 还 真是 麻烦 呀 。 


同样 是 73 分 ， 但 生 
物 分 数 的 价值 比较 
! 


一 个 好 东西 ， 那 就 是 
m, 


我 想到 





将 分 数 的 价值 转换 成 
易于 讨论 的 数据 ! 


= 标准 计 分 


标准 化 的 计算 方法 就 是 (每 一 数据 ) 一 (平均 数 ) 
eae 


标 


标准 化 后 的 数据 ， 称 为 
“标准 计 分 " 





历史 和 生物 的 考试 成 绩 及 其 标准 计 分 


BRO Be 73-53 __20_- 0,98 
衣 的 历史 标准 半分 Lo oe 


由 美的 生物 标准 计 分 





1. 标准 计 分 : Standard Scores 
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标准 化 后 ， 求 出 标准 计 分 具有 





















































SPA 1007 HBB 
MRR N 20074 B 
@ 无 论 作 为 变量 的 满分 为 几 分 ， 其 标准 计 分 的 平均 数 4 —— — 
势必 为 0， 而 其 标准 差 势 必 为 1 


RBS StF 
@ 无 论 作为 变量 的 单位 是 什么 ， 其 标准 计 分 的 平均 数 本 
势必 为 0， 而 其 标准 差 势必 为 1 | 


由 于 标准 计 分 中 ， A) 胜 负 立 判 呀 [ 


0.88 < 1.09 
(历史 ) (生物 ) 


因此 ， 哪 一 个 73 分 较 有 价值 ， 
我 起 应 该 可 以 很 明显 地 看 出 来 
7e! 
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而 有 全， 离 差 就 是 应 用 标准 计 分 
所 得 的 数值 哦 ! 


来 算 算 看 ， 你 们 考 
试 分 数 的 离 差 吧 ! 


标准 计 分 
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CY ne 
——— 


@ 无 论 作为 变量 的 满分 为 几 分 ， 其 标准 计 分 的 
平均 数 势必 为 0， 而 其 标准 差 势必 为 1。 | 
@ 无 论 作为 变量 的 单位 是 什么 ， 其 标准 计 分 的 
平均 数 势必 为 0， 而 其 标准 差 势必 为 1。 


@ 无 论 作为 变量 的 满分 为 几 分 ， 其 离 差 的 平均 | 


数 势必 为 50， 而 其 标准 差 势必 为 10。 
@ 无 论 作为 变量 的 单位 是 什么 ， 其 标准 计 分 的 
平均 数 势必 为 50， 而 其 标准 差 势必 为 10。 





那么 ,今天 的 课程 就 
N 到 此 为 止 吧 ! 
p | O * 
A 


7 

Y 对 于 考试 成 绩 来 说 ， 就 
算 只 是 一 分 之 差 也 影响 
深远 ， 所 以 才 会 使 用 离 
差 这 个 指标 吧 ! 


我 呢 ， 觉 得 这 个 和 这 RSI 1 A 
个 都 不 错 呢 ! —* (A anert 


BEABBREM 














山本 老师 ， 我 们 开 吃 啦 ! Q 








4. 关于 离 差 的 解释 窜 


在 此 ， 有 必要 加 强 离 差 的 解说 。 
离 差 如 同 74 页 的 解说 ， 是 以 下 述 算式 求 得 的 : 


~ (每 一 数据 ) - (平均 数 ) 
离 差 = 标准 计 分 x 10+50= — — x 10+50 

那么 ， 琉 衣 的 班 上 ， 如 同 61 页 中 说 明 的 ， 全 班 共有 40 人 。 琉 衣 班 上 的 “ 女 
生 ”， 如 40 页 所 示 ， 共 有 18 人 。 所 以 69 页 的 离 差 实例 ， 并 非 以 全 班 同学 为 对 象 ， 而 
仅 以 女生 为 对 象 。 若 以 全 班 同学 为 对 象 ， 平 均 数 和 标准 差 的 值 就 会 和 仅 以 女生 为 对 
象 时 过 然 不 同 ， 琉 衣 和 由 美的 离 差 值 也 势必 有 差异 产生 。 实 际 上 ， 若 以 全 班 同学 为 
对 象 的 情况 下 ， 琉 衣 的 离 差 值 较 高 。 全 班 的 测验 结果 如 表 4.1 所 示 。 请 各 位 务必 试 着 
算 算 离 差 。 我 先 将 答案 说 出 来 ， 琉 衣 的 历史 成 绩 离 差 值 为 59.1， 而 由 美的 生物 成 绩 离 
差 值 为 56.7。 


另外 ,假设 在 2 年 1 班 及 2 年 2 班 也 举办 了 相同 的 测验 。2 年 1 班 只 求 出 自己 班 上 的 
平均 数 和 标准 差 ， 再 以 此 为 基础 ， 求 出 离 差 值 。2 班 也 只 求 出 自己 班 上 的 平均 数 和 标 
准 差 ， 再 以 此 为 基础 ， 求 出 离 差 。 结 果 ，1 班 的 A 同 学 和 B 同 学 实力 相当 。 然 而 ， 由 于 
求 出 A 同学 和 B 同 学 的 离 差 值 时 ， 所 采用 的 平均 数 和 标准 差 并 不 一 致 ， 既 然 两 班 的 平 
均 数 和 标准 差 并 不 相同 ， 那 么 两 人 的 离 差 值 并 无 可 比 性 。 


我 再 举 个 例子 ，A 同 学 于 4 月 间 参 加 了 某 补习 班 的 模拟 测验 ， 其 考试 成 绩 的 离 差 
值 为 54。 而 在 暑期 补习 班 中 努力 用 功 的 A 同学 ， 为 了 想 确认 实力 提升 了 多 少 ，9 月 间 
又 参加 了 另 一 个 补习 班 所 举办 的 模拟 测验 ， 其 考试 成 绩 的 离 差 值 为 62。 从 两 次 离 差 
值 来 看 ， 乍 看 之 下 ，A 同 学 的 实力 似乎 有 所 提升 。 然 而 ， 由 于 4 月 和 9 月 之 模拟 测验 分 
数 的 举办 者 不 同 ， 因 此 考生 不 相同 。 再 加 上 ， 从 4 月 与 9 月 的 考试 结果 ， 在 欲求 出 离 
差 之 际 ， 所 使 用 的 平均 数 与 标准 差 一 定 不 同 ， 因 此 无 法 就 两 者 得 出 的 离 差 做 比较 。 


各 位 觉得 如 何 呢 ? 关于 离 差 的 解释 ， 相 当 有 深度 啊 ! 
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ANH 





琉 衣 59 

由 美 61 
A 14 47 
B 41 38 
iG 49 63 
D 87 56 
E 69 15 
F 65 53 
G 36 80 
H 7 50 
I 53 41 
J 100 62 
K 57 44 
L 45 26 
M 56 91 
N 34 35 
o 37 53 
P 70 





儿 表 4.1 历 史 和 生物 的 测验 结果 ( 琉 衣 的 全 班 同学 ) 





HEE 







mo mn on 


~ ooo 


<£ 


全 班 同 学 成 绩 的 平均 数 
全 班 同学 成 绩 的 标准 差 
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例题 和 解答 
Besse eee eee ees eee eee eee ees 
例题 
下 表 为 高 中 女子 100 米 的 短跑 成 绩 
100 米 短跑 


( 秒 ) 
16.3 


22.4 
18.5 
18.7 
20.1 
19.2 
标准 差 ”| 2.01 









(1 ) 请 确认 “100 米 短跑 成 绩 的 标准 计 分 ”之 平均 数 是 否 为 0 
(2 ) 请 确认 “100 米 短跑 成 绩 的 标准 计 分 ”之 标准 差 是 否 为 1 


第 4 章 标准 计 分 和 离 差 








(D“100 米 短跑 的 标准 成 绩 ”之 平均 数 


163-192) , (224-192) , (185-192) , (187-192) , (201-192 
人 2.01 } + ( 201 } + ( 2.01 ) y ( 201 } re ( 201 ) 
* 3 


{ (16.3—19.2)+(22.4-19.2)+(18.5—19.2)+(18.7—19.2)+(20.1—19.2) | 
am 

















[ent ies eam 2 19.2~19.2-19.2~19.2 
= 2.01 
= 5 
96-19.2x5 
erm 














163-192 ， H2 r 18.5-19.2 ， 18.7-19.2 4 (201-1924) 
201 201 201 201 


163-192)’, (224-192), (185-192), (18.7-19.2 Y , (20.1-19.2) 
| 2.01 J+ 201 ) ( 201 n 201 J+ 20 


























SORT HE O oan — A) 
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“标准 化 即 为 ， 以 距离 平均 数 的 远近 程度 及 数据 的 “离散 程度 ”为 基础 ， 将 数 
据 的 价值 转换 为 易于 探讨 的 数值 。 
* 若 执行 标准 化 ， 则 可 以 比较 


.满分 不 同 的 变量 
.单位 不 同 的 变量 


“标准 化 后 的 数据 称 为 标准 计 分 。 
* 求 离 差 值 必须 应 用 到 标准 计 分 。 
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统计 学 中 有 时 会 提 到 “ 某 
某 机 率 ” 小 于 0.05 一 一 


4! 
抱歉! 

那 机 率 是 指 会 出 现在 天 气 预报 
中 的 那 种 机 率 吗 ? 


今天 就 来 恋恋 求 “ 某 某 机 
率 ” 所 须 具备 的 知识 吧 ! 


但 是 ， 从 现在 起 所 学 的 知识 ， 
在 统计 学 中 会 常常 出 现 ， 一 定 
要 认真 听讲 啊 ! 













大屋 的 全 体高 三 学 生 英 语 测验 结果 
英语 测验 结果 







参加 了 某 补 习 班 的 英 
语 测验 ， 结 果 如 下 。 











假设 A 县 的 全 体 
高 三 学 生 ， 











英语 漠 驻 结果 的 丰 方 图 (组 距 为 10) 6 若 将 这 份 直方 图 的 组 
距 缩小 ， 结 果 会 变 得 


R! 
果然 做 成 直方 图 后 
比较 容易 理解 啊 ! 


因为 视觉 效 物 


果 比 较 好 ! 


— 





组 距 和 “英语 测验 结果 ”的 直方 图 





A! 
渐渐 接近 于 曲线 啊 ! 











84 第 5 章 RNE 


直方 图 中 ， 将 距离 缩小 至 极 
限 后 ， 所 得 之 曲线 的 公式 ， 


在 统计 学 上 称 为 “机 
率 密度 函数 '”! 











> EER HR BH, 
理论 上 是 像 上 图 一 样 具 
有 各 种 形态 的 。 


1. 机 率 密度 函数 : Probability Density Function ,简称 “pdf”。 





今天 将 为 你 介绍 特别 
重要 的 几 种 图 形 。 
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被 称 为 “自然 对 数 的 底 ”， 


其 值 大 约 为 2.7182 


ERAR “n” 
Wali T | 
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ANH Bh HB 
形 ， 具 备 以 下 特征 : 


。 以 平均 值 为 中 心 星 左 
右 对 称 


， 受 到 平均 值 和 标准 差 
的 影响 





, WABAIS 








40 


f(x)= 


[27 x15 


e 


xs: 
3) 





A 平均 值 为 53， 标 准 着 为 5 





0.08 
0.06 
0.04 


0.02 


| eo 20 4 





A PHEA, RBS 








0.08 


0.06 
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XHMFEERHREAMAGHA: 
sg 


= Se AS gr 
1) = x 


则 统计 学 上 ， 以 “x 服 从 平均 值 为 OO， 标准 差 为 XX 的 正 态 分 布 ” 来 表 
示 。 





总 之 ， 虽 然 算 式 有 些 
复杂 ， 但 还 是 请 你 努 
力 理解 吧 ! 





PHEARS, AŽ AKERA 
那么 ， 我 们 以 刚才 考试 


的 例子 来 作 一 下 解说 。 
fore * 

如 果 “ 英 语 测验 结果 ” we 

ORE Rte eB 








第 5 章 RNE 


就 会 以 ““ 英 语 测验 结果 ”服从 平均 
值 为 53， 标 准 差 为 10 的 正 坊 分 布 ”来 
表示 。 





XxX 的 机 率 密 度 函 数 若 为 
1 
A(x) = 


则 不 会 以 “x 服从 平均 值 为 0， 标 准 差 为 1 的 正 态 分 布 ” 来 表示 ， 在 统计 学 上 会 以 
“x 服从 标准 正 态 分 布 ” 来 表示 。 


1p Cex 的 下 为人) 
— — 
V2 xx 的 标准 产 VY27 x1 











让 我 们 仍 以 刚才 的 “英语 “英语 测验 结果 ”服从 平均 值 为 53 ， 
测验 结果 ”的 例子 来 看 ! 标准 差 为 10 的 正 态 分 布 。 


英语 测验 结果 
(标准 化 后 ) 





—— 


3.2 





Z- PR-PHE _ 50-53 _ -3 _ 
GAB * =o 





如 果 这 样 ， 则 标准 化 后 的 “英语 测 
验 结果 ”为 …… 





标准 正 态 分 布 

















* 
* 
x 
$ 
s 
i 
a4 
不 


2 
€ 
a 
z 


SARERM! 
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S.C. YWYV hl 


SS 


ss 
= 





标准 正 态 分 布 表 
z | 000 | 0.01 | 0.02 | 0.03 | 004 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 
0.0000 | 0.0040 | 0. 0.0120 | 0.016 | 0.0199 | 0.0239 | 0.0279 | 0.0319 | 0.0359 
0.0398 | 0.0438 | 0. 0.0517 | 0.0557 | 0.0596 | 0.0636 | 0.0675 | 0.0714] 0.0753 
0.0793 | 0.0832 | 0. 0.0910 | 0.0948 | 0.0987 | 0.1026 | 0.1064 | 0.1103 | 0.1141 














0.4641 | 0.4649 | 0. 0.4664 | 0.4671 | 0.4678 | 0.4686 | 0.4693 | 0.4699 | 0.4706 


0.4713 | 0.4719 | 0.4726 | 0.4732 | 0.4738 | 0.4744 | 0.4750 | 0.4756 | 0.4761 | 0.4767 
































we 


— 这 个 部 分 的 面积 是 可 以 求 
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首先 =1.96 想 成 
那么 ， 我 们 假设 


+ Fz 
Fi 


z=1.96 来 看 一 下 。 


\ 


ARAB he 


RA, 








“1.9” 的 行 和 “0.06” 的 
列 之 交叉 处 


M! 

差点 忘 了 告诉 你 ， 所 有 的 标准 正 态 分 布 
之 机 率 害 度 函数 的 图 形 和 横 轴 所 围 成 的 
面积 都 是 1 哦 ! 


是 的 ! 
这 就 是 z=1.96 时 的 面积 。 





那么 ， 现 在 开始 要 说 明 的 内 容 就 是 
今天 的 “ 主 某 ”。 请 用 心 听讲 。 





标准 正 态 分 布 的 图 形 和 横 轴 围 成 的 面积 ， 
与 其 比例 及 机 率 是 相同 的 。 





加 平均 值 为 5， 标准 差 为 10 的 正 态 分 布 表 中 ， 下 图 斜 线 部 分 的 面积 为 0.5。 





0.05 
0.04 
0.03 
0.02 
0.01 











0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 








Q 得 分 在 45 分 以 上 的 考生 比例 ， 占 全 体 考生 总 数 的 0.5 (=50% ) 。 

图 从 全 体 考生 中 ， 随 机 抽出 一 人 ， 其 得 分 在 45 分 以 上 的 机 率 为 0.5 (=50% ) 。 

图 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 布 中 ，0 以 上 的 考生 比例 ， 占 全 体 
考生 总 数 的 0.5 (=50% ) 。 








0.5 
0.4 
0.3 
0.2 














0.29 


© 从 全 体 考生 中 ， 随 机 抽出 一 人 。 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 
布 中 ， 他 的 标准 计 分 为 0 以 上 的 机 率 为 0.5 (=50% ) 。 
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因为 平均 值 是 45 分 ， 所 以 可 
以 画 出 以 45 分 处 为 高 峰 ， 左 
右 对 称 的 图 形 。 


其 中 得 分 在 45 分 以 上 的 ， 正 好 占 | 
图 形 的 右 半边 ， 因 此 是 50% 。 fz 


— LÀ 








这 种 程度 的 内 容 我 
当然 可 以 理解 啦 。 
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OFHHN45, 标准 差 为 10 的 正 态 分 布 中 ， 下 图 斜 线 部 分 的 面积 为 
0.5-0.4641=0.0359。 












0.05 







0.04 







0.03 







0.02 







001 
















o 
0 5 10 15 20 25 30 35 40 45 50 55 6065 70 75 80 85 90 95100 
的 























O 得 分 在 63 分 以 上 的 考生 ， 占 全 体 考 生 的 0.5-0.4641=0.0359 (=3.59% ) 。 
国 从 全 体 考生 之 中 ， 随 机 抽出 一 人 ， 其 得 分 在 63 分 以 上 的 机 率 为 
0.5-0.4641=0.0359 ( =3.59% ) 。 

图 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 布 中 ， 


05 



















04 







03 







02 







01 



























4 3 













二 .18 _ 63-45 _ BRF y = 
= — 以 上 的 考生 比例 ， 从 标准 正 态 分 布 表 可 
清楚 得 知 ， 占 全 体 考生 的 0.5-0.4641=0.0359 (=3.59% ) 。 

回 从 全 体 考生 之 中 ， 随 机 抽出 一 人 。 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 


分 布 中 ， 他 的 标准 计 分 为 1.8 以 上 的 机 率 为 0.5-0.4641=0.0359 ( =3.59% ) 。 


18 
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你 能 理解 真是 太 好 了 。 


A 
确实 面积 = 比例 = 机 率 
有 


不 仅 限于 标准 正 态 分 布 ， 无 
论 是 哪 种 机 率 密度 函数 ， 
面积 = 比例 = 机 率 

的 关系 都 是 成 立 的 


请 务必 记 住 哦 ! 





接 下 来 ， 我 来 介绍 下 一 个 y 
机 率 密度 函数 吧 ! = 
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84. EADS 





还 有 一 种 叫 作 卡 方 
名 称 听 来 像 是 
个 很 难 理解 的 


XH PRR Rh RH, 


x>0 时 ， 1 


Awa A 


22x fle ed 


上 述 以 外 的 情况 则 为 0 
， 用 “x 服从 自由 度 * 为 〇 〇 的 卡 方 分 布 ” 来 表示 。 








因为 琉 衣 的 反应 
若非 数学 家 则 不 必 对 这 个 式 子 很 有 趣 ， 所 以 才 
进行 讨论 ， 因 此 请 不 要 担心 。 故意 让 你 看 这 种 


总 之 ， 先 来 看 看 自由 
度 为 2、10 以 及 20 等 
情况 下 的 图 形 吧 ! 





1. 卡 方 分 布 :Chisquare Distributions 2. 自由 度 : Degree of Freedom. 


加 自由 度 为 2 的 情况 








自由 度 不 同 ， 图 形 
的 形状 也 完全 不 同 
M! 


自由 度 为 10 的 情况 


园 自由 度 为 20 的 情况 





没 错 ! 
1 次 函数 /fc)=ax+b 之 中 ， Fax+ 随 着 a 值 的 改变 ， 图 形 
4 称 为 什么 呢 ? 的 倾 针 度 也 会 跟着 改变 
吧 


“自由 度 ” 和 “斜率 ”一 样 ， 都 
是 会 影响 图 形 形 状 的 数值 。 


所 以 只 要 自由 度 的 值 有 所 
改变 ， 图 形 的 形状 也 会 随 
之 改变 





就 像 标准 正 态 分 布 有 标准 正 态 
分 布 表 一 样 ， 卡 方 分 布 也 有 卡 —F 
方 分 布 表 。 





就 是 记录 了 对 应 这 个 部 分 的 机 率 
(= 面积 =- 比例) 已 的 横 轴 刻度 x? 
之 值 的 表 。 





那 读 做 “ 卡 方 ”。 





BAS 


0.995 


0.975 


0.95 


0.05 









































0.025 


那么 


看 一 下 这 张 表 。 


0.01 


0.005 





nH BCMWIDAARWNR 


0.000039) 
0.0100 
0.0717 
0.2070 
0.4118 
0.6757 
0.9893 
1.3444 


1.7349 








2.1558 


0.0010 
0.0506 
0.2158 
0.4844 
0.8312 
1.2373 
1.6899 
2.1797 
2.7004 
3.2470 








0.0039 
0.1026 
0.3518 
0.7107 
1.1455 
1.6354 
2.1673 
2.7326 
3.3251 
3.9403 


3.8415 
5.9915 
7.8147 
9.4877 
11.0705 
12.5916 
14.0671 
15.5073 
16.9190 
18.3070 








5.0239 
7.3778 
9.3484 
11.1433 
12.8325 
14.4494 
16.0128 
17.5345 
19.0228 
20.4832 





6.6349 
9.2104 
11.3449 
13.2767 
15.0863 
16.8119 
18.4753 
20.0902 
21.6660 
23.2093 





FRR ERD AE 


PAR SALI | 


虽然 很 像 ,但 还 是 


HARAR! 





7.8794 
10.5965 
12.8381 
14.8602 
16.7496 
18.5475 
20.2777 
21.9549 
23.5893 
25.1881 





* i 卡 方 分 布 表 则 是 记录 对 应 
标准 正 态 分 布 表 为 记录 对 应 
横 轴 的 刻度 之 机 率 的 表 ， 机 率 之 横 轴 刻 度 的 表 。 


试想 一 下 ， 自 由 度 为 1， 
P 为 0.05 时 的 Xx? 的 值 。 


1 的 行 和 0.05 的 列 的 交 丸 处 > 
dnb 就 是 3.8415。 
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R5. tpt & 


统计 学 上 ， 以 下 的 机 率 密度 函数 经 常 出 现 。 


自由 度 十 1 





自由 度 +1 | 。 
Ps ae 2 
J= —— * (+ ane) 
VATHHExaxfex 2 Te ”dx 
x 的 机 率 密度 函数 若 如 上 述 ， 在 统计 学 上 则 以 “x 服 从 自由 度 为 x x 的 (分 配 ” 来 
































表示 。 
国 自 由 度 为 5 的 情况 
06 
05 
04 
03 
02 
o1 
0 — 
6 4 2 0 2 4 6 
6. FAB =| 
统计 学 上 ， 以 下 的 机 率 密度 函数 也 是 经 常 出 现 的 主题 。 
sl Maarman a) nah SIAE, (第 2 自由 度 ) BH x 
/m= Peri) (eae) "Gin eine ofa) SAE 
上 述 以 外 的 情况 为 0 


x 的 机 率 密度 函数 若 如 上 述 所 示 ， 在 统计 学 上 则 以 “x 服 从 自由 度 为 OO， 第 2 自 
由 度 为 x x 的 F 分 布 ”来 表示 。 
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国 第 1 自由 度 为 10， 第 2 自由 度 为 5 的 情况 

















0 2 4 6 8 10 


& 71. “XX Spt” FAEXCEL & 


如 果 不 使 用 标准 正 态 分 布 表 及 卡 方 分 布 表 来 计算 机 率 及 横 轴 的 刻度 ， 在 电脑 尚 
未 普及 时 ( 约 是 20 世 纪 90 年 代 初期 ) ， 这 些 计算 对 个 人 而 言 是 相当 浩大 的 工程 。 因 
此 ， 这 些 分 布 表 实 在 是 相当 重要 的 “宝物 ”。 然 而 ， 现 今 已 经 不 太 使 用 分 布 表 了 。 
因为 使 用 EXCEL 的 函数 计算 功能 ， 便 可 轻松 地 求 出 分 布 表 中 的 值 ， 不 仅 如 此 ， 比 起 
分 布 表 ，EXCEL 还 可 以 求 出 更 多 种 类 的 值 。 

我 将 与 “x x 分配” 相关 的 函数 总 整理 如 下 表 。 


令 表 5.1 与 “X X 分 配 ”相关 的 函数 





可 计算 对 应 横 轴 刻 度 的 机 率 


可 计算 对 应 横 轴 刻 度 的 机 率 


可 计算 对 应 横 轴 刻 度 的 机 率 


可 计算 对 应 横 轴 刻 度 的 机 率 


可 计算 对 应 横 轴 刻 度 的 机 率 





1. 正 态 分 布 : 由 于 正 态 分 布 的 机 率 密 度 函数 受到 平均 值 和 标准 差 的 影响 。 因 此 即使 想 做 出 “ 正 态 分 布 表 ” 
也 是 不 可 能 的 。 然 而 ， 利 用 EXCEL 来 求 出 与 “ 正 态 分 布 表 ”相当 的 值 却 非常 便利 。 
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ee : 
例题 
(1 ) 请 利用 93 页 的 标准 正 态 分 布 表 表示 出 下 图 斜 线 部 分 的 机 率 。 
— i 
> 0.5 — | 1 
J 04 | B 
1 | | r 
L | 0.3 1 
i | 0.2 i 
1 0.1 | G 
1 I 1 
1 * 1 
Li * a 
I 1 
' a 
1 (2) 请 利用 103 页 的 卡 方 分 布 表 求 出 自由 度 为 2，P 为 0.05 时 的 X 的 值 。 1 
. ` 
L 1 
a 1 
A (1) 必须 求 出 的 机 率 ， 和 下 图 斜 线 部 分 的 机 率 相同 。 
1 — a 
i 0.5 ~ = r 
Li ' 
1 0.4 1 
s 0.3 p 
J L 
a 0.2 Li 
f 01 h 
1 0 1 
a -4 -3 -2 -1 0 1 = 3 4 ' 
Li Li 
1 0.29 
欲求 出 z=0.29=0.2+0.09 的 情况 下 的 机 率 ， 可 从 标准 正 态 分 配 表 得 知 ， 是 
0.1141。 因 此 ， 必 须 求 出 的 机 率 为 0.5-0.1141=0.3859。 1 
1 (2) 根据 卡 方 分 布 表 ， * 的 值 ， 其 值 为 5.9915。 i 
keene eee see eee ee a 
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。 代 表 性 的 机 率 密度 函数 ， 可 举 出 与 下 列 对 应 者 : 
日 正 态 分 布 
曙 标 准 正 态 分 布 
m E 
里 ! 分 布 


m FAA 
。 机 率 密度 函数 的 图 形 和 横 轴 所 围 成 的 面积 为 1。 
。 机 率 密度 函数 的 图 形 和 横 轴 所 围 成 的 面积 ， 可 视 为 与 比例 及 机 率 相同 。 
。 若 利用 “x x 分布 表 ” 或 Excel 的 函数 ， 则 可 求 出 ， 

里 对 应 横 轴 刻 度 的 机 率 

里 对 应 机 率 的 横 轴 刻度 
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双 变 量 的 相关 分 析 




























aa cara 


A RR R 























你 那 是 什么 打扮 呀 ! 
FRR TO! 


如 果 能 和 五 十 
BAR 


今天 就 来 恋恋 双 


























“是 否 居住 地 不 同 ， 
支持 的 政党 也 会 不 
同 ", 等 等 。 












例如 ,，“ 是 否 身高 越 高 ， 体 重 
WAL", AR*REAFH fA 


不 同 ， 喜 欢 的 啤酒 品牌 也 不 
oy ee 








园 " 身 高 ”和 “体重 ”的 散布 图 (Scatter Diagram) 


S 
W 
ÈN 


b2 
60 
$8 
名 
$4] 
$2 
so 


($9 (60 (62 (6 166 (68 (70 172 
身高 


“ 音 欢 的 啤酒 品牌 ”和 “年 龄 ”的 散布 图 





做 成 图 表 后 ， 我 们 就 
可 以 知道 它们 是 否 与 
双 变 量 相关 联 。 
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4 
La 
3 
* 
R 
£ 

=: 
2 
g 
* 


关联 的 程度 。 
像 这 样 的 内 容 也 能 用 
统计 学 来 分 析 吗 ? 


通常 我 会 结合 图 形 ， 
然后 求 出 用 来 表示 2 变 
数 的 关联 程度 的 指标 








宽 二 相 关系 数 客 














对 了 ， 有 “化妆品 费 " 和 
“ERE HALAS | 










A 小 姐 
B 小 姐 5000 8000 
















C 小 姐 12000 25000 
D 小 姐 2000 5000 
E 小 姐 7000 12000 
F 小 姐 15000 30000 
G 小 姐 5000 10000 
H 小 姐 6000 15000 
I 小姐 8000 20000 


J 小姐 


TRA ERRA W ERM LKA 
ERA 
30000 


20000 


10000 


那么 ， 我 们 试 着 求 


A! A | 出 两 者 的 关联 "程度 ” 
看 来 似乎 花 较 多 钱 在 化 妆 品 ! 


上 的 人 也 会 花 较 多 的 钱 买 衣 
EN | 
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— 




















数值 数据 和 ae FAME — 

数值 数据 | 相关 系数 | 1~! VERE —— 

— ge | o~ ame 

分 类 数据 | FAE | o~ | HAES + MEF — 

BE SRI La © 
VE —— 


分 类 数据 





相关 系数 


“化 妆 品 费 " 和 
“ 置 装 费 "为 “ 相 


KAR", 


= wPI27 "3. 











WHER — 
[AEREI HERR {Sex S> 


DARBEDE 








25000000 
0 
25000000 





























1, 相关 系数 : Correlation Coefficient. 2. 共 变异 数 : Covariance. 3. 变异 数 : Variances 


117 


Sxw 290000000 


ASxxX Soy 7 100000x 606000000 


相关 系数 的 值 是 
0.9680 ! 
iA 


而 且 ， 落 两 个 变量 的 相关 。 如 果 关 联 性 越 弱 ， 相 关 - r - 
性 越 强 ， 则 相关 系数 就 会 。 系数 则 会 越 接近 0。 由 于 这 个 结果 相当 接近 1， 所 以 


"化妆品 费 " 和 “ 置 装 费 " 的 关联 性 
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如 同 本 次 ， 相 关系 数 的 值 若 为 正 


值 ， 则 称 为 "* 正 相关 " ; 反之 ， 
SAR, Mea TAPAS’. 


在 统计 学 上 , “车 其 值 在 XX 以 
上 则 可 说 两 个 变量 关联 性 较 强 ” 
的 基准 是 不 存在 的 。 


若 为 0， 则 称 为 
不 相关 "。 
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相关 系数 值 之 意义 





相关 系数 的 绝对 值 
1.0~0.9 
0.9 ~0.7 
0.7 ~0.5 











相关 性 非常 弱 





那 就 或 多 或 少 参 考 
一 下 相关 系数 值 的 
含义 吧 ! 


之 前 说 过 ， 相 关系 数 为 表示 数值 数据 与 数值 数据 的 关联 性 
程度 的 指标 。 不 过 ， 严 格 说 来 并 非 如 此 。 相 关系 数 为 清楚 表示 
数值 数据 与 数值 数据 之 间 是 否 具有 “直线 性 ”关联 的 指标 。 


不 适用 于 相关 系数 的 例子 


相关 系数 =-0.0825 | 
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内 2. 相 关 比 内 











E KONR ESAE 
品 


牌 
Termes 


有 "年 龄 "和 "喜欢 的 Chanellio 
服装 品牌 "的 问卷 调 — 


Burpurry 


Chanellio 
Termes 
Chanellio 
Termes 
Burpurry 
Burpurry 
Chanellio 


Termes 





Burpurry 
Chanellio 


Burpurry 


这 个 指标 也 是 越 接近 1， 
关联 性 越 强 吗 ? 











1. 相关 比 : Correlation Ratios 


"喜欢 的 服装 品牌 ”和 “年 龄 ” 











那么 ， 就 来 实际 地 算 一 
下 相关 比 的 值 吧 | 





A N AN 
RO 4H 


—— 
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相关 比 的 值 ， 只 要 依照 以 下 的 步骤 1 到 步骤 4 的 计算 ， 


进行 如 下 表 的 计算 。 


(Termes— Termes (Chanellio—Chanellio (Burpurry 一 
的 平均 值 )* 的 平均 值 )? 的 平均 值 ? 


(23—26) =(—3)=9 (25 一 29) 一 (一 4 一 16 (15—21}=(—6)}=36 





(26—26}=0°=0 (26—29 =(—3)=9 (16—21}=(—5}=25 


(27-26 =V=1 (29—29) =0°=0 (18—21)=(—3)=9 


(28—26)'= (32-29) 22-21}=1=1 


83—29 =4=16 26—21} =5°=25 


(29—21 =8=64 





160 











求 出 组 内 变异 ， 也 就 是 Srr +Scc +Sas 








Srr+Scc+Sas=14+50+160=224 
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组 间 变 异 ， 也 就 是 求 出 : 


(Termes 的 数据 个 数 x ( Termes 的 平均 值 -整体 平均 值 + ( Chanellio 的 
数据 个 数 x (Chanellio 的 平均 值 -全 体 平 均值 )?+ ( Burpurry 的 数据 个 数 ) x 
( Burpurry 的 平均 值 





4x (26-25)+5x (29-25 p+6x (21-25)? 
=4 x 1+5 x 16+6 x 16 

=4+80+96 

=180 











步骤 4 
Sencar 级 间 变 异 
相关 比 的 值 ， 也 就 是 求 出 一 一 一 一 一 一 。 

F 求 出 EAER 


= — 
180 180 9 4455 
224+180 404 ` 





“年 龄 "和 “喜欢 的 服装 品牌 "相关 比 的 
为 
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“喜欢 的 服装 品牌 ”和 “年 龄 ”的 散布 图 ( 相关 比 的 值 为 1 ) 。 





50 


40 


30 


20 











10 
Termes Chanellio Burpurry 


相关 比 的 值 为 ! <ES> 各 组 所 含 数据 相同 <> 组 内 变异 为 0 | 
“喜欢 的 服装 品牌 ”和 “年 龄 ”的 散布 图 ( 相关 比 的 值 为 0) 。 


50 














40 





30 


20 











1 
sd Termes Chanellio Burpurry 


相关 比 的 值 为 0 <> FAP <> 组 间 变 异 为 0 
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“相关 比 的 值 在 XX 以 上 ， 则 可 说 两 变量 关联 性 强 ” 这 类 
标准 ， 在 统计 学 上 是 不 存在 的 。 
请 参考 下 列 相关 比 的 值 之 意义 。 


相关 比 的 值 若 大略 上 划分 
100.8 =œ 相关 
0.8-05 => 相关 
0.5~0.25 => 相关 性 有 点 弱 相关 

未 满 0.25 > 相关 性 非常 弱 不 相关 








那么 ， 由 于 本 次 的 结果 是 0.4455， 因 此 意思 是 “ 相 
关 性 有 点 弱 ”。 








28 3. 克 莱 姆 相关 系数 窜 








接 下 来 ， 如 果 有 可 以 说 明 关 于 分 类 
数据 的 例子 就 好 了 。 


“咨询 300 位 高 中 生 ! 
你 希望 对 方 用 什么 样 的 方式 向 你 
AG?” 
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话说 回来 ， 女 性 杂志 还 
真是 会 做 一 些 奇 妙 的 问 











希望 当面 被 衣 白 的 男性 回答 者 ， 在 152 人 中 占 了 ?36 人 .。 


“人 性别” 和“ 镑 望 的 衣 白 方式 ”的 交 又 资料 闪 ( 行 2%) 
| Cr ëűě | 
ies | 发 短信 | Yo 
23 4l 36 
| pe | 2s | 2% |] 
E SENTA 


ABYGAGCHRHESS, 4152A, 5 
774/152 100=49 (%) . 





koi 
相 比 较 而 言 ， 女 生 比 较 希 望 
“发 短信 和 表白"， 
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女生 和 男生 希望 的 换 身 话说 , “性别 " 和 “希望 的 
表白 方式 确实 有 一 表 自 方式 "是 有 相关 的 。 


表示 分 类 数据 和 分 类 数 
据 之 间 相 关 程 度 的 指标 


“ 克 莱 姆 相关 系数 "也 可 称 为 
“ 克 莱 姆 的 关联 系数 、 
“ 克 莱 姆 V" 或 “独立 系数 "。 


1. 克 莱 姆 相关 系数 : Cramer's Vo 


琉 衣 ， 你 在 听 吗 ?了 





克 莱 姆 相关 系数 的 值 ,可 用 下 列 步骤 1 到 步骤 5 的 计算 方式 
来 求 出 。 





| 准备 交叉 资料 表 。 此 外 ， 粗 框 内 的 各 个 数值 ， 称 为 观测 次 数 !。 











进行 下 表 的 计算 。 此 外 ， 粗 框 内 的 各 个 数值 ， 称 为 期 望 次 数 > 





希望 的 表白 方式 
打 电 话 短信 当面 


148x72 148x101 148x127 
300 300 300 














152x72 152x101 152x127 
eee 152x101 ss 
300 














“男性 ”的 合计 x“ 当 面 ” 的 合计 
数据 个 数 ? 














1. 观测 次 数 : Observed Frequency。 2. 期 望 次 数 : Expected Frequency. 
130 #68 双 变量 的 相关 分 析 





LOVE es EL 
72 十 101 十 127 ”72 十 101 十 127 ` 72+101+127 





172: 101 : 127= 


三 2 
300 ` 300 ` 300 


IZ SREI, 
152% 300 300 





y DRI IRI) ye 
每 笔 数值 以 — — 来 计算 。 


希望 的 表白 方式 


148x101 Y 
—— 


148x101 


= Jo 
300 
152x101 
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步骤 4 
求 出 步骤 3 的 表 中 粗 框 内 的 值 之 总 和 ， 意 即 皮尔 森 的 卡 方 统计 量 之 值 。 此 
外 ， 皮 尔 森 的 卡 方 统计 量 ， 以 下 用 “Xi” 表 示 。 


(64 men y i ary’ G- * 
300 


148x72 148x101 148x127 
300 300 300 


& uen y E 152x zor) Ka 3) 


152x72 152x101 152x127 
300 300 300 








x+ 

















如 同步 骤 3 中 的 说 明 ， 


意 即 “性 别 ” 和 “希望 的 表白 方式 ”之 
则 皮尔 森 的 卡 方 统计 量 也 会 越 大 。 
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步骤 5 
求 出 克 莱 姆 相关 系数 的 值 ， 即 








Xo 
— (min{ 交 叉 资料 表 的 行 数 , 交叉 资料 表 的 列 数 } 一 1 ) 


此 外 ，min{a，b} 为 表示 a 和 b 中 较 小 的 值 之 记号 


/ 8.0091 =j; 8.0091 = oe 
300x(min{2, 3}—1) 300x(2—1) 300 








因此 ， 克 菜 姆 相关 系数 的 值 
为 0.1634。 
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一 个 人 根本 没 办 法 计 














如 果 还 有 不 懂 的 地 方 
AMRM TUT E 
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“性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 
( 克 莱 姆 相关 系数 为 1 ) 


希望 的 表白 方式 








发 短信 
83 
0 








克 莱 姆 相关 系数 的 值 为 ! <> 女性 和 男性 的 喜好 完全 不 同 








“性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 
( 克 莱 姆 相关 系数 为 0 ) 


pis | 
— 








克 莱 姆 相关 系数 的 值 为 0o <> 女性 和 男性 的 喜好 完全 相同 
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克 莱 姆 相关 系数 的 值 之 意义 


相关 性 非常 强 


相关 性 有 点 弱 


由 此 可 见 ， 我 们 举 的 例子 中 的 两 个 
变量 的 相关 性 非常 强 。 
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AX, REKRAT REM 
相关 系数 ， 而 下 一 次 会 利 
用 这 个 知识 点 学 习 “ 独 立 
Bie", 





独立 性 检验 是 经 只 是 学 会 它 ， 就 可 以 说 
erent eed AY pa ie 


所 以 下 次 是 最 后 一 堂 课 
了 吗 ? 





1, 独立 性 检验 : Test of Independence。 


137 





Fees 
例题 

经 营 家 庭 餐馆 的 A 公 司 ， 最 近 经 营 状况 并 不 太 好 。 因 此 必须 用 心 倾听 顾客 
的 声音 ， 所 以 针对 “居住 在 日 本 的 20 岁 以 上 居民 ”以 随机 抽样 进行 问卷 调查 。 
结果 如 下 表 所 示 。 























你 — 
在 种 附 
家 比 免 
庭 较 费 
餐 好 的 
馆 ? £ 
i ti 
i 料 
类 
x a 
红 
茶 
m̃ 
回答 者 1 x 中 式 料理 < 咖啡 
回答 者 2 ne 西式 料理 “i 咖啡 
回答 者 250 | | 日 式 料理 | … 红茶 





用 上 表 做 成 的 交叉 资料 表 如 下 所 示 。 
咖啡 和 红茶 哪 一 种 比较 好 ? 
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请 求 出 “在 家 庭 餐 馆 常 点 的 料理 种 类 是 ? ”和 “ 若 附 免费 的 餐 后 饮料 ， 咖 
啡 和 红茶 哪 一 种 比较 好 ? ”的 克 莱 姆 相关 系数 值 。 
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准备 交叉 资料 表 。 























咖啡 和 红茶 哪 一 种 比较 好 ? 


104x127 
250 

70x127 
250 
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140 





z (观测 次 数 一 期 望 次 数 
计算 出 各 个 表格 里 的 — — 


咖啡 和 红茶 哪 一 种 比较 好 
p rk | 


16x127 下 
@- 250 ) 
-6x127 


104x127 
G- 250 6-2) 


104x127 








> 
+ 


76 


104 
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求 出 步骤 3 的 表 中 粗 框 内 的 值 之 总 和 ， 意 即 皮尔 森 的 卡 方 统计 量 
Xi 之 值 。 
76x123 76x127 
= me) 250 amy ee) 250 wy 
— 
250 
Gi- 104x any — 
250 250 
+ osn —— 
250 250 
70x123 下 10x127 下 
ie 250 ) @- 250 ) 
70x123 70x127 
250 250 
=3.3483 


BE 


求 出 克 莱 姆 相关 系数 的 值 ， 即 


/ x 

数据 个 数 x ( min{ 交 叉 资料 表 的 行 数 , 交叉 资料 表 的 列 数 } 一 1 ) 
/ 3.3483 =- [338 n See 
250x(min{3, 2}—1) 250x(2—1) 250 —— 
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G2 
。 相 关系 数 为 表示 数值 数据 和 数值 数据 的 关联 程度 之 指标 。 
。 相关 比 为 表示 数值 数据 和 分 类 数据 的 关联 程度 之 指标 。 
。 克 莱 姆 相关 系数 ( 也 可 称 作 克 莱 姆 关联 系数 或 克 莱 姆 V ) 为 表示 分 
类 数据 和 分 类 数据 的 相关 程度 之 指标 。 
。 相 关系 数 、 相 关 比 和 克 莱 姆 相关 系数 的 特征 如 下 表 所 示 。 


。 相 关系 数 、 相 关 比 和 克 莱 姆 相关 系数 中 ， 在 统计 学 上 ， 并 无 “其 值 
若 在 XX 以 上 时 ， 则 两 变量 的 关联 性 较 强 ” 的 标准 。 
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TO, KR, REL 
] 提 过 的 新 校服 吗 ? 





























2 
上 次 的 课程 中 ， 我 们 学 习 了 
克 莱 姆 相关 系数 ， 对 吧 ! 


— —— 那 份 问卷 调查 是 从 “居住 在 日 本 的 
2 全 体高 中 生 " 中 随机 抽样 的 结果 ， 


结论 是 一 一 相关 性 非常 弱 "。 


只 不 过 是 300 人 的 资料 
所 得 的 推论 结果 。 


如 果 再 抽样 调查 另外 的 
300A, 


RRM WK ABA 
应 该 绝对 不 会 是 0.1634 
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你 认为 原始 的 总 体 一 一 
“居住 在 日 本 的 全 体高 中 
生 "的 克 菜 姆 桐 关系 数 是 
SYR? 


没 错 。 如 果 没 有 收集 到 "居住 
在 日 本 的 全 体高 中 生 "的 资料 
的 话 ， 


不 仅 限于 那个 例子 ， 一 般 而 
言 ， 我 们 是 不 可 能 知道 总 体 的 
克 莱 姆 相关 系数 的 值 。 
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对 于 总 体 的 克 “因为 从 随机 抽出 300 人 的 资料 所 以 总 体 的 交 莱 姆 相关 
中 ， 所 推论 的 克 莱 姆 相关 系数 系数 大 约 为 这 个 数值 。 
为 0.1634， 


也 只 能 这 样 主观 地 判断 了 。 


不 过 利用 统计 学 ， 
或 许可 以 做 些 什么 
吧 ? 


ee PH 


人 


不 ! 即使 运用 统计 学 ， 很 
可 惜 地 ， 我 们 还 是 无 法 严 
庶 地 得 知 克 莱 姆 相关 系数 
的 值 。 
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HE 究竟 是 否 为 0"， 是 可 
相关 系数 的 值 一 以 知道 的 ! 





是 类 似 英 检 的 





























只 要 使 用 之 前 提 过 的 
因为 可 以 得 到 客观 的 名 为 "独立 性 检验 "的 
总 体 信息 呀 ! 分 析 方 法 即 可 。 





i 首先 就 什么 是 “检验” 
独立 性 检验 是 统计 学 上 S 做 一 下 说 明 吧 ! 
总 称 为 "检验 "的 分 析 方 : 
法 
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“检验 "这 个 名 词 ， 正 确 
所 谓 的 “检验 ” 指 的 是 ， 从 所 设立 是 否 正确 的 分 析 说 来 ， 应 该 称 为 "统计 
样本 的 资料 推测 分 析 者 对 于 的 假说 检验 "。 
总 体 


See lees 


可 使 用 的 情况 之 实例 
推测 总 体 中 ，“ 性 别 ” 和 “希望 的 表白 方式 ”的 克 莱 姆 相关 系数 
之 值 是 否 为 0。 


推测 总 体 中 ，“ 喜 欢 的 服装 品牌 ”和 “年 龄 ”的 相关 比 之 值 是 否 
为 0。 


推测 总 体 中 ，“1 个 月 使 用 的 化 妆 品 费用 ”和 “1 个 月 使 用 的 置 装 
费 ” 的 相关 系数 之 值 是 否 为 0。 


推测 东京 都 的 女 高 中 生 和 大 阪 府 的 女 高 中 生 “ 每 月 的 零花 钱 ”是 
总 体 平均 数 差 检验 GAR. 于 注意 ， 这 个 例子 中 设 定 了 商 个 总 体 


推测 居住 于 都 市 的 有 投票 权 者 和 居住 于 农村 的 有 投票 权 者 中 ， 对 
总 体 比例 差 检验 | “ x x 内 阁 的 支持 率 ”是 否 不 同 。 

















类 注意 ， 这 个 例子 中 设 定 了 两 个 总 体 
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“检验 "的 种 类 虽然 有 
很 多 种 ， 但 分 析 的 程 
序 却 是 一 样 的 。 


“检验 ”的 程序 





【步骤 1】 定义 总 体 。 

【步骤 2】 建立 虚无 假说 !: 和 对 立 假说 

【步骤 3 | 选择 要 进行 的 “检验 ”种 类 

【 步骤 4 】| 决定 置信 水 平 : 

【步骤 5】 从 样本 资料 求 出 检验 统计 量 的 值 

【步骤 6 】 | 调查 【 步 又 5 】 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 *4 之 中 。 

【步骤 7】 若 【 步骤 6 】 的 检验 统计 量 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 正 
确 ”。 反 之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ” 





























Pad 


这 些 内 容 我 根 A \ 待 会 再 好 好 向 你 解说 。 
本 看 不 懂 ! 





1. 虚无 假说 : Null Hypothesis。 2. 对 立 假说 :Altemative Hypothesis, 3. 置信 水 平 : Confidence level。 4. 拒绝 域 :Rejection Regiono 
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几 2. 独 立 性 检验 实 





那么 ， 现 在 开始 讲 今天 
的 主题 “独立 性 检验 "。 


换 身 话说 ， 就 是 推测 "交叉 资料 
表 中 的 两 变量 是 否 相关 "的 分 析 


所 谓 的 "独立 性 检验 " 指 的 是 ， 推 测 " 总 体 的 克 菜 姆 
相关 系数 的 值 究竟 是 否 为 0" 的 分 析 方 法 。 








从 总 体 “居住 在 日 本 的 全 体高 中 生 ” 中 随机 抽取 300 人 。 


es o 


[ 居住 在 日 本 的 : [ 居住 在 日 本 的 全 体高 中 生 ] 

















对 步 又 1 中 抽出 的 300 人 进行 127 页 的 问卷 调查 ， 以 求 出 皮尔 森 卡 方 统计 量 o 


将 随机 抽出 的 300 人 送 回 总 体 。 


持续 重复 步骤 1~ 3。 


如 此 一 来 ， 若 做 为 总 体 的 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 其 克 莱 姆 相关 系数 
为 0%， 则 实验 中 皮尔 森 卡 方 统计 量 Xi 之 图 形 为 自由 度 为 2 的 卡 方 分 布 。 换 名 话说， 车 
做 为 总 体 的 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 克 莱 姆 相关 系数 为 0， 则 “实验 中 的 皮 
尔 森 卡 方 统计 量 ”服从 自由 度 为 2 的 卡 方 分 布 。 


= 森 的 卡 方 统计 量 x6 的 算法 ， —— 
由 度 为 2 的 卡 方 分 布 ， 请 参照 100 页 ， 
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。 由 于 真正 以 “居住 在 日 本 的 全 体高 中 生 ” 为 对 象 的 实验 是 不 可 能 实现 的 ， 因 此 将 表 
7.1 中 记载 的 1 万 人 的 集合 ， 解 释 为 “居住 在 日 本 的 全 体高 中 生 ”。 
。 将 “居住 在 日 本 的 全 体高 中 生 ” 中 的 克 莱 姆 相关 系数 设 为 0。 意 即 ， 女 性 和 男性 在 
“ 想 在 电话 中 表白 : 想 在 短信 中 表白 : 想 当 面 表白 ”的 比例 是 相等 的 (请 参照 135 
页 ) 。 实 际 将 表 7.1 的 交叉 资料 表 做 成 表 7.2。 
“* 由 于 实验 永 无 止境 ， 因 此 重复 步骤 1~ 3 的 步骤 20000 次 后 就 结束 。 


儿 表 7.1 ”希望 的 表白 方式 ( 居住 在 日 本 的 全 体高 中 生 ) 


R72 “性 别 ” 和 “希望 的 表白 方式 ”之 交叉 资料 表 


希望 的 表白 方式 
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实验 结果 如 表 7.3。 图 7.1 是 以 表 7.3 为 基准 所 绘 出 的 直方 图 。 
令 表 7.3 ”实验 结果 








0.5 55 10.5 15.5 





$071 ”以 表 7.3 为 基准 之 直方 图 ( 组 距 为 1 ) 





154 #7% 深入 理解 独立 性 检验 


“居住 在 日 本 的 全 体高 中 生 " 的 克 莱 姆 
相关 系数 的 值 为 0 


意 即 “性 别 " 和 “希望 的 表 自 方式 "并 无 
关联 。 


那么 ， 从 “居住 在 日 本 的 全 体高 中 生 " 中 
选 出 300 人 进行 问卷 调查 


做 了 一 次 又 一 次 …… 又 一 次 | 


这 个 图 形 就 是 自由 度 为 2 时 的 卡 
BRB | 





E 


(PRR ee 


wees, Pte Yep, 


w 


Y 
= 
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那么 ， ARRATEN 进行 独立 性 检验 吧 ! 
问卷 调查 为 











从 现在 起 ， 我 们 的 课程 就 以 
“wR = RR 


贺 7 





这 样 的 方式 来 进行 啦 


分 成 "分析 者 "和 "解说 
者 "来 说 明 ， 会 让 " 解 
REF RMA | 
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凉 凉 出 版 社 将 “询问 300 名 高 中 生 ! 你 希望 对 方 用 什么 样 的 方式 向 你 表白 ? ”的 
报道 刊载 于 女性 杂志 “P-girls” 中 。 凉 凉 出 版 社 从 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 
随机 抽出 300 人 ， 进 行 了 问卷 调查 。 其 结果 如 下 表 所 示 。 


—— 
zal 
E o| 


总 体 “ 居 住 在 日 本 的 全 体高 中 生 ” 中 ，“ 性 别 ” 和 “希望 的 表白 方式 ”的 克 莱 姆 
相关 系数 的 值 是 否 大 于 0， 也 就 是 “性 别 ” 和 “希望 的 表白 方式 ”是 否 有 关联 ， 请 利 
用 独立 性 检验 来 推测 。 此 外 ， 我 们 将 置信 水 平 ( 待 后 说 明 ) 设 为 0.05。 
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PBs 


如 同 152~154 页 中 的 解说 ， 若 总 体 “居住 在 日 本 的 全 体高 中 

生 ” 中 的 克 莱 姆 相关 系数 为 0， 则 “皮尔 森 卡 方 统计 量 ”是 服从 
自由 度 为 2 的 卡 方 分 布 。 因 此 ， 若 总 体 “ 居 住 在 日 本 的 全 体高 中 
生 ” 中 的 克 菜 姆 相关 系数 的 值 为 0， 则 由 随机 抽出 的 300 人 的 资料 所 a 
D 





求 出 的 双 若 为 5.9915 以 上 的 机 率 ， 则 能 从 103 页 的 卡 方 分 布 表 中 清 
楚 得 知 ， 其 值 为 0.05。 





5.9915 
图 7.2 X 为 5.9915 以 上 的 机 率 


本 例题 的 奴 在 132 页 就 已 计算 完毕 ， 其 值 为 8.0091。 怎 么 会 这 样 呢 ? 虽然 是 由 随 
机 抽出 300 人 的 资料 所 求 出 的 值 ， 看 起 来 似乎 还 是 太 高 了 吧 ! 若 以 132 页 的 评论 为 基础 
来 思考 ， 总 体 “居住 在 日 本 的 全 体高 中 生 ” 的 克 莱 姆 相关 系数 的 值 大 于 0 的 想法 ， 是 
不 是 就 很 自然 呢 ? 

不 仅 限 于 这 个 例题 ， 在 说 明 独 立 性 检验 时 ， 我 会 以 

四 暂且 解释 为 “总 体 的 克 莱 姆 相关 系数 的 值 为 0” 

@ 由 样本 的 资料 求 出 发 

@ 若 癌 过 大 ， 则 结论 为 “总 体 的 克 莱 姆 相关 系数 的 值 大 于 0” 

这 样 的 流程 进行 说 明 ， 请 先 记 下 来 。 
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接 下 来 ， 将 为 前 一 段落 的 @) 做 补充 。 
发 越 大 ， 则 下 图 和 斜 线 部 分 的 机 率 理应 越 小 。 


g 
图 7.3 ”对 应 的 机 率 


独立 性 检验 中 ， 若 上 图 斜 线 部 分 的 机 率 在 名 为 置信 水 平 的 值 以 下 ， 则 可 做 “总 体 的 克 
莱 姆 相关 系数 的 值 大 于 0” 的 结论 。 置 信 水 平一 般 设 为 0.05 或 0.01， 采 用 何者 则 完全 取 
决 于 分 析 者 的 判断 。 


现在 假设 采用 0.05 的 置信 水 平 。 实 际 上 ， 所 谓 的 置信 水 平 就 是 指 下 图 斜 线 部 分 的 
机 率 。 


5.9915 


图 7.4 ”再 现 图 7.2 (=X 在 5.9915 以 上 的 机 率 ) 


此 外 ， 下 图 的 范围 称 为 拒绝 域 。 


5.9915 


图 7.5 (置信 水 平 0.05 时 ) 拒绝 域 
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建立 虚无 假说 和 对 立 假说 。 











选择 进行 的 “检验 ”种 类 。 
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决定 置信 水 平 。 
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从 样本 资料 求 出 检验 统计 量 的 值 。 
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调查 步骤 5 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 中 。 
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若 步骤 6 的 检验 统计 量 值 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 正确 ”。 反 


之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
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检验 统计 量 的 值 如 果 不 在 
拒绝 城中 ， 似 乎 可 说 "虚无 
假设 是 正确 的 " 呀 


举例 来 说 ， 请 假设 刚才 例题 的 
可 惜 的 是 ， 并 不 能 这 么 说 和 为 25013。 
只 能 说 "无 法 判定 虚无 假设 为 误 "而 已 。 


此 值 并 不 在 拒绝 域 
之 中 吧 ! 
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因此 ， 当 然 不 可 以 作出 "总 — 然而 , 却 不 能 断言 "总 体 的 
体 的 克 莱 姆 相关 系数 的 值 3 克 莱 姆 相关 系数 为 0”。 
大 于 0" 的 结论 。 


再 来 举 个 更 容易 
理解 的 例子 吧 | 
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假设 由 美 具有 非常 有 利 的 不 在 场 证 明 。 


那么 ， 假 设 由美 只 能 
举 出 令 人 怀疑 的 不 在 
场 证 明 。 


然而 ， 也 不 能 因此 就 断 
定 “ 由 美 就 是 犯人 "。 


如 果真 是 这 样 ， 就 没有 余地 反 晓 "由美 
不 是 犯人 "的 结论 。 





BA tH, MERE 
法 做 出 “由美 不 是 犯人 ” 
的 结论 。 




















E 3. 虚 无 假说 和 对 立 假说 ca 
Se 里 还 有 布丁 。 1 






那么 ， 在 进行 "检验 "时 ， 


话说 回来 ， 诬 无 假说 和 对 
立 假说 是 什么 了 其 实 ， 很 难 用 三 言 两 语 来 说 
明 虚 无 假说 和 对 立 假说 。 


刚才 你 说 等 一 下 委 说 明 ， 
但 我 还 没 听 到 ? 





170 #78 深入 理解 独立 性 检验 


与 其 就 庶 无 假说 和 对 立 假说 是 什么 
作 说 明 ， 不 如 解释 怎样 的 假说 算是 
座 无 假说 和 对 立 假说 吧 | 


“检验 ”的 实例 





名 称 


可 使 用 的 情况 之 实例 





独立 性 检验 


推测 总 体 中 ，“ 性 别 ” 和 “希望 的 表白 方式 ”的 克 莱 姆 相关 系数 
之 值 是 否 为 0 





相关 比 检验 


推测 总 体 中 ，“ 喜 欢 的 服装 品牌 ”和 “年 龄 ”的 相关 比 之 值 是 否 
H0. 





无 相关 检验 


推测 总 体 中 ，“1 个 月 使 用 的 化 妆 品 费用 ”和 “1 个 月 使 用 的 置 装 
费 ” 的 相关 系数 之 值 是 否 为 0 





总 体 平 均 数 差 检验 


都 的 女 高 中 生 和 大 阪 府 的 女 高 中 生 “ 每 月 的 零花 钱 ” 是 


于 注意 ， 这 个 例子 中 设 定 了 两 个 总 体 





总 体 比 例 差 检 验 


这 是 在 149 页 出 现 过 
的 表格 。 





推测 居住 于 都 市 的 有 投票 权 者 和 居住 于 农村 的 有 投票 权 者 中 ， 对 
“x x 内 阁 的 支持 率 ” 是 否 不 同 


素 注 意 ， 这 个 例子 中 设 定 了 两 个 总 体 





就 以 这 张 表格 的 
例子 来 进行 说 明 
e! 
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图 独立 性 检验 
: 总 体 中 “性 别 ” 和 “希望 的 表白 方式 ”之 克 莱 姆 相关 系数 的 值 为 0。 





说 | 总 体 中 “性 别 ”和 “希望 的 表白 方式 ”之 克 莱 姆 相关 系数 的 值 大 于 0。 


图 相关 比 检验 


总 体 中 “喜欢 的 服装 品牌 ”和 “年 龄 ”之 相关 比 的 值 为 0。 





总 体 中 “喜欢 的 服装 品牌 ”和 “年 龄 ”之 相关 比 的 值 大 约 0。 


图 无 相关 检验 





总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “1 个 月 使 用 的 装置 费 ” 
数 的 值 为 0。 


前 总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “1 个 月 使 用 的 装置 费 ” 
数 的 值 不 为 0。 
或 
中 总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “1 个 月 使 用 的 装置 费 ” 之 相关 系 
数 的 值 大 于 0。 


或 


总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “1 个 月 使 用 的 装置 费 ” 之 相关 系 
数 的 值 小 于 0。 
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国 总 体 平均 数 差 检验 
BE | 东京 都 的 女 高 中 生 和 大 阪 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 相 等 。 
| 东京 都 的 女 高 中 生 和 大 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 不 相等 。 





或 


| 比 起 东京 都 的 女 高 中 生 ， 大 上 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 较 
多 。 


比 起 东京 都 的 女 高 中 生 ， 大 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 较 
少 。 


国 总 体 比例 差 检 验 


居住 在 都 市 的 有 投票 权 者 和 居住 在 农村 的 有 投票 权 者 中 ,对 “XX 内 阁 
的 支持 率 ” 相 等 。 


居住 在 都 市 的 有 投票 权 者 和 居住 在 农村 的 有 投票 权 者 中 ,对 “XX 内 阁 
的 支持 率 ” 不 相等 。 


| 或 
| 比 起 居住 在 都 市 的 有 投票 权 者 ， 居 住 在 农村 的 
| 有 投票 权 者 ， 对 “x x 内 阅 的 支持 府 ” 较 高 。 \、 
oa 或 
| 比 起 居住 在 者 市 的 有 投票 权 者 ， 居 住 在 农村 的 
有 投票 权 者 ， 对 “ x x 内 阅 的 支持 率 ” 较 低 。 


原来 如 此 | / 
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诬 无 假说 中 ， 被 推论 为 并 非 " 总 体 的 交 
菜 姆 相关 系数 的 值 越 接近 ' 于 0"， 而 是 
— 
难以 证 明 的 假说 ， 你 明白 了 吗 ? 


因此 ， 虚 无 假说 就 是 “是 1" 看 来 难以 证 明 的 假说 
做 为 诬 无 假说 ， 而 和 

虚无 假说 对 立 的 假说 

则 称 为 对 立 假说 。 


“Xxx 为 相等 "的 肯定 假说 ， 


而 对 立 假说 则 为 "不 是 Xx“Xx 不 相等 ” 
的 否定 假说 。 


你 了 解 了 吗 ? 
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4.P 值 和 “检验 ”的 顺序 灾 





依 " 检 验 "的 种 类 

不 同 ， 思 考 方式 

多 少 会 有 所 不 同 在 虚无 假说 为 真 的 情况 下 ， 
则 本 次 求 出 的 值 为 大 于 或 等 


FX MOR. 
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在 电脑 普及 前 ， 要 算出 
了 P 值 可 是 相当 浩大 的 工 
Ae | 


直到 20 世 纪 4o 年 代 初 期 。 


因此 ， 以 往 作 为 "检验 " 
结论 的 根据 


现在 由 于 使 用 EXCEL 
就 可 求 出 P 值 ， 所 以 采 
用 四 的 情况 也 越 来 越 
多 了 。 












— A 
E 


mas all i 












Guill; 











四 和 刚才 解说 过 的 
OAPRERE ER 





— ac) 
[Zew 
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调查 在 步骤 5 所 求 出 的 检验 统计 量 值 相对 应 的 P 值 ， 是 否 比 置信 水 平 小 。 
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在 步骤 6p 所 得 的 P 值 若 小 于 置信 水 平 ， 即 可 作出 “对 立 假说 为 正确 ”的 结 
论 。 反 之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
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art Col 
a SS 


即使 P 值 大 于 置信 水 平 ， 虽 看 似 
可 以 作出 “虚无 假说 为 正确 "的 结 
论 ， 但 实际 上 并 不 可 以 








Vy, 
Ke ‘ 








我 
到 底 是 为 了 什么 才 那 么 拼命 Š 
OER IT ET? 啊 ? 


难道 你 不 是 真 
的 对 统计 学 感 





be ve DE vooo... 
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咱们 两 个 人 的 课程 还 会 继续 …… 
RB? 








穷 5. 独 立 性 检验 和 齐 性 检验 窜 





齐 性 检验 (test of homogeneity ) 与 独立 性 检验 是 非常 类 似 的 “检验 ”方法 。 
齐 性 检验 的 例子 如 下 所 示 。 请 一 边 阅读 ， 一 边 思考 和 独立 性 检验 的 差异 。 





“询问 300 名 高 中 生 ! 你 希望 对 方 用 什么 样 的 方式 向 你 表白 ? ” 
* 打 电话 

。 发 短信 

。 当 面 


的 报道 ， 凉 凉 出 版 社 刊载 在 女性 杂志 “P-girls” 之 中 ， 然 而 凉 凉 出 版 社 早已 设立 
下 列 假说 。 












说 
候 打 电话 : 发 短信 : 当面 
的 人 数 比 ， 女 高 中 生 和 男 高 中 生 有 所 不 同 。 


因此 ， 为 了 确定 上 述 的 假说 是 否 正 确 。 凉 凉 出 版 社 从 “居住 在 日 本 的 全 体 女 高 


中 生 ” 和 “居住 在 日 本 的 全 体 男 高 中 生 ” 中 ， 各 随机 抽出 一 些 人 进行 实际 的 问卷 调 
查 。 其 结果 如 下 表 。 
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然后 “性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 如 下 。 


请 月 








希望 的 表白 方式 _ 











合计 
女性 148 
男性 152 





齐 性 检验 来 推测 上 述 的 假说 是 否 正确 。 而 其 置信 水 平 设 为 0.05。 











步骤 1 


假设 “居住 在 日 本 的 全 体 女 高 中 生 ” 和 “居住 在 
日 本 的 全 体 男 高 中 生 ” 为 总 体 。 





步 又 2 


建立 虚无 假说 和 对 立 假 


虚无 假说 为 

““ 打 电话 : 发 短信 : 当面 ”的 比例 ， 两 者 相 
对 立 假说 为 

““ 打 电话 : 发 短信 : 当面 ”的 比例 ， 两 者 不 相 





BMS | ayk 


步骤 4 


选择 要 进行 的 “检验 ” 


进行 齐 性 检验 。 





决定 置信 水 平 。 


假设 置信 水 平 为 0.05。 





从 样本 资料 求 出 检验 统 
计量 的 值 。 


本 例题 中 欲 进行 的 是 齐 性 检验 。 因 此 检验 统计 量 
为 皮尔 森 卡 方 统计 量 X 。 本 例题 中 的 X 值 已 在 
132 页 计算 完毕 。X。 =8.0091。 且 本 例题 中 ， 若 虚 
无 假说 为 真 ， 则 皮尔 森 统计 量 % 为 服从 自由 度 
(2-1) x (3-1) =1 x 2=2 的 卡 方 分 布 。 





调查 在 步骤 5 所 求 出 的 检 
验 统计 量 值 ， 是 否 在 拒 
绝 域 之 中 。 


检验 统计 量 Xe 的 值 为 8.0091。 由 于 置信 水 平 a 为 
0.05， 因 此 根据 103 页 的 卡 方 分 布 表 ， 拒 绝 域 为 
小 9 915” 以上。 检验 统计 量 的 值 在 拒绝 域 之 





步骤 7 





若 步 又 6 的 检验 统计 量 值 
在 拒绝 域 之 中 ， 则 结论 
为 “对 立 假说 正确 ”。 

反之 ， 则 结论 为 “无 法 





判定 虚无 假说 为 误 ”。 


检验 统计 量 的 值 在 拒绝 域 之 中 。 因 此 对 立 假说 为 
““ 打 电话 : 发 短信 : 当面 ”的 比例 ， 两 者 不 相 
等 ”为 正确 。 





ſſ——— ⸗ —— — 
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如 何 ? 例题 和 解答 都 和 独立 性 检验 的 例子 几乎 相同 。 

下 面 我 们 来 确认 独立 性 检验 和 齐 性 检验 的 相 异 之 处 。 

相 异 处 有 3 点 。 首 先 ， 定 义 的 总 体 不 同 。 前 者 是 “居住 在 日 本 的 全 体高 中 生 ” 的 
一 群 总 体 ， 后 者 则 是 “居住 在 日 本 的 全 体 女 高 中 生 ” 和 “居住 在 日 本 的 全 体 男 高 中 
生 ” 的 两 类 总 体 。 此 外 ， 假 说 也 不 相同 。 前 者 是 


总 体 的 克 莱 姆 相关 系数 的 值 为 0 

=“ 性 别 ” 和 “希望 的 表白 方式 ”不 相关 。 
总 体 的 克 莱 姆 相关 系数 的 值 大 于 0 

=“ 性 别 ” 和 “希望 的 表白 方式 ”相关 。 








而 后 者 是 
虚无 假说 | ( 打 电 话 : 发 短信 : 当面 ) 的 比例 ， 两 者 等 。 
对 立 假说 ( 打 电 话 : 发 短信 : 当面 ) 的 比例 ， 两 者 不 相 


o 


另外 ， 顺 序 也 不 太一 样 。 前 者 是 收集 资料 后 才 建立 假说 ， 而 后 者 是 在 收集 资料 
前 就 先 建立 假说 。 

如 同 前 段 所 说 明 的 ， 独 立 性 检验 和 齐 性 检验 有 明确 的 相 异 点 。 然 而 ， 实 际 上 ， 
通常 的 情况 是 ， 本 来 想 做 独立 性 检验 ， 却 误 做 了 齐 性 检验 ， 或 是 想 要 两 种 都 做 做 看 ， 
之 所 以 想 进行 独立 性 检验 ， 通 常 是 因为 已 经 进行 了 齐 性 检验 ， 或 是 想 进行 齐 性 检验 
时 ， 通 常 是 因为 已 经 进行 了 独立 性 检验 。 因 此 ， 请 特别 注意 。 
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[_&6. “OW” MARRAS 


到 目前 为 止 “ 检 验 ” 中 的 结论 都 是 以 





若 检验 统计 量 的 值 在 拒绝 域 之 中 ， 则 做 出 “对 立 假说 为 正确 ”的 结论 。 反 之 ， 则 





作出 “无 法 判定 虚无 假说 为 误 ” 的 结论 。 


来 表现 。 但 实际 上 ， 这 样 的 表现 方式 并 非 一 般 性 的 。 
“检验 ”的 结论 的 表现 形式 有 很 多 种 ， 效 总 整理 于 下 表 。 





OR74 “检验 ”的 结论 表现 









| -无 法 判定 虚无 假说 为 误 。 





对 立 假说 为 正确 。 





"有 信心 。 :无 信心 。 
“放弃 虚无 假说 。 .无 法 放弃 虚无 假说 。 
“保留 虚无 假说 
.无 法 判定 虚无 假说 为 不 真 。 


“采纳 虚无 假说 。 

“有 信心 ”“ 无 信心 ”的 表现 不 是 比较 易于 使 用 吗 ? 那么 ， 为 什么 我 要 故意 使 
用 非 一 般 性 的 表现 ? 真正 的 理由 如 下 所 述 。 

我 想 恐 怕 只 是 想 确认 检验 统计 量 的 值 和 P 值 的 大 小 吧 ! 我 已 经 注意 到 ， 学 习 “ 检 
验 ” 的 人 之 中 ， 有 些 人 在 完全 不 了 解 用 途 的 状况 下 ， 就 轻易 地 将 “有 信心 ”时 常 挂 
在 嘴 边 。 这 些 人 完全 不 了 解 “ 有 信心 ”的 意义 ,事实 上 他 们 是 在 未 确立 虚无 假说 和 
对 立 假说 之 下 ， 就 直接 进行 “检验 ”。 我 认为 这 些 人 根本 不 明白 总 体 的 定义 。 以 前 
我 也 曾 想 过 : 对 于 才刚 开始 学 统计 学 的 人 再 怎么 吹 毛 求 症 也 没 用 。 然 而 ， 若 对 虚无 
假说 和 对 立 假说 的 意义 不 明了 ， 又 怎么 下 结论 ? 果然 ， 吹 毛 求 症 并 不 是 这 么 无 理 的 
要 求 。 因 此 ， 本 书 为 了 让 虚无 假说 和 对 立 假说 可 以 永存 于 读者 脑海 中 ， 特 别 使 用 了 
“对 立 假说 为 正确 ”和 “无 法 判定 虚无 假说 为 误 ” 的 表现 方式 进行 处 理 。 
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= 
r 

例题 1 
下 表 为 沿用 前 一 章 138 页 的 交叉 资料 表 。 

咖啡 和 红茶 哪 一 种 比较 好 7 i 
Pi 红茶 | 
日 式 料理 43 33 76 1 
We To) si 3 104 : 
i 

1 

r 

L 

Li 

' 

1 




















ae 中 式 料理 29 41 70 





合计 123 127 250 

请 用 独立 性 检验 推测 总 体 为 “居住 在 日 本 20 岁 以 上 的 人 ”之 中 ，“ 常 点 的 料理 种 

类 ”和 “ 匣 虽 利 红茶 哪 一 种 比较 好 ?” 的 克 莱 姆 相关 系数 的 值 是 否 大 于 0， 意 即 “ 常 点 的 
IE 料理 类 别 ” 和 “咖啡 和 红茶 哪 一 种 比较 好 ?” 是 否 有 关联 。 另 外 ， 置 信 水 平 设 为 001。 


















































L a 
i 1 
MESET 设 “ 居 住 在 日 本 20 岁 以 上 的 人 ”为 总 体 i 
' EARS CRON A OE 8 
H appa 建立 虚无 假说 和 对 立 假 | 和 红茶 哪 一 种 比较 好 ?” 有 相关 = 
i 说 。 对 立 假说 为 “常食 用 的 料理 种 类 ”和 “咖啡 t 
: 和 红茶 哪 一 种 比较 好 ?” 不 相关 。 ' 
I EREE — 
em ET RR MN | 进行 独立 性 检验 。 i 
- [i 
! BRA E E BEIM FACE 0.01, ' 
' — | hie, BR ' 
求 出 检验 统 | 、 — 
了 | tt ee | toca erste. Rpm! 
* Ea | 各 值 已 在 141 页 计算 完毕 。X3 =3.3483。 
调查 步骤 5 所 求 出 的 检验 统计 量 Xo 的 值 为 3.3483。 由 于 置信 水 平 a 
1 De igo ot > : HRA “9.2104” Wk. RRS HRA 1 
: 拒绝 城 之 中 。 | 在 拒绝 域 之 中 。 
DA 的 检验 统计 
' BP RON RTE | 检验 统计 重 的 值 不 再 拒绝 域 之 由 BD | 
在 拒绝 域 之 中 ， 则 结论 | erit SY 
1 mer] oy reem. | 判定 虚无 假说 一 “党 点 的 料理 种 关 " 和 
， ERAR E 两 者 有 相关 ' 
A 判定 虚无 假说 为 1 
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。 所 谓 “ 检 验 ” 指 的 是 ， 由 样本 数据 来 推测 分 析 者 针对 总 体 所 建立 的 假 
说 是 否 正确 的 分 析 方 法 。 

。“ 检 验 ” 的 正确 名 称 为 统计 的 假说 检验 。 

。 检 验 统计 量 是 将 样本 数据 转换 为 1 个 数值 的 公式 。 

。 置 信 水 平一 般 都 设 为 0.05 或 0.01。 

。 拒 绝 域 为 对 应 置信 水 平 的 范围 。 

。 独 立 性 检验 为 推测 “总 体 的 克 莱 姆 相关 系数 的 值 是 否 为 90” 的 分 析 方 
法 。 也 可 说 是 推测 “交叉 资料 表 中 的 两 变量 是 否 有 关联 ”的 分 析 方 法 。 

。 若 总 体 的 克 莱 姆 相关 系数 的 值 为 0%， 则 “皮尔 森 卡 方 统计 量 X” ”为 遵守 
卡 方 分 布 。 

。 虚 无 假说 若 为 真 ， 独 立 性 检验 中 的 P 值 ， 为 求 出 大 于 或 等 于 本 次 所 求 出 
的 皮尔 森 卡 方 统计 量 X 之 机 率 。 

。 在 “检验 ”中 , 下 结论 的 根据 有 2 种 : 

O 检验 统计 量 的 值 是 否 在 拒绝 域 中 。 


@ P 值 是 否 小 于 置信 水 平 。 
。 无 论 是 否 为 独立 性 检验 ， 其 “检验 ”分 析 顺 序 均 相同 。 具 体 来 说 ， 如 
下 所 述 。 





建立 虚无 假说 和 对 立 假说 。 





选择 要 进行 的 “检验 ”种 类 。 





决定 置信 水 平 。 





从 样本 数据 求 出 检验 统计 量 的 值 。 





调查 在 步 又 5 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 之 中 。 





车 在 步骤 6 中 检验 统计 量 的 值 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 
成 立 ”。 若 非 如 此 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 





调查 与 在 步骤 5 所 求 出 的 检验 统计 量 值 相对 应 的 P 值 ， 是 否 比 置信 
水 平 小 。 





步 又 6P 所 得 的 P 值 若 小 于 置信 水 平 ， 则 可 作出 “对 应 假说 正确 ”。 
反之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
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运用 EXCEL 计算 

















在 此 ， 利 用 Excel 函 数 功能 进行 解说 。 
1. 做 成 次 数 分 布 表 (的 一 部 分 ) 

2. 算出 平均 数 、 中 位 数 、 标 准 差 

3. 做 成 "次 数 分 布 表 ”( 的 一 部 分 ) 

4. 算 出 标准 分 数 、 离 差 

5. 算 出 标准 正 态 分 布 的 机 率 

6. 算 出 卡 方 分 布 的 横 轴 刻度 


7. 算 出 相关 系数 的 值 
8. 独立 性 检验 
F 已 经 熟悉 Excel 函 数 功能 的 读者 ， 建 议 你 先 从 “2 算出 平均 数 、 中 位 数 、 标 准 差 " 人 
辆 做 成 次 数 分 布 表 〈 一 部 分 ) 
使 用 33 页 的 资料 
选取 “J3" 单 元 格 。 
日 元 日 元 s P 

S a 
Hm 600| amti. 650, 5600 700 699) 
ELO 650, 拉面 局 29 580. 700 800 799 
Hms * 拉面 馆 30 750, S00 900 899) 
拉面 馆 5 750, 拉面 馈 31 800. 900, 1000! 999 
拉面 馆 7 500, 拉面 馆 32 S50, 
Hite 890, RMRI 750, 
拉面 局 9 880, 拉面 局 34 700, 
拉面 馆 10 700, — 600. 
Rmt 890) 拉面 局 36 800, 
— 120, RRT 800. 
拉面 馆 13 5690， “拉面 局 33， 830. 
aame — 
拉面 馆 16 oro mtia 780) 
— 580 — 600, 
拉面 馆 18 300 — 610, 
a 
— 850 拉面 馆 46 890, 
— 700, 拉面 馆 47 930, 
拉面 馆 23 780， 拉面 馆 48 650. 
拉面 馆 24 850， | 拉面 馆 49 m. 
拉面 馆 25 750, 拉面 馆 50 700, 
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从 工具 栏 的 “插入 ”中 选 “ 函 数 ” 一 项 。 





BAG [SAO TAD 
ESTI 
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238822838 


SATIS AE, MAF, ERAT IS IT AEE 
IEEEEE 
AENA CIF) 次 数 
500| 600i 59 4 
00,100,699 
Too. 800, 199 


‘300,900,899 
900, 1000, 999) 


点 数学 式 中 的 这 个 部 分 。 





同时 按 下 “Shift” 键 和 “Ctrl” 键 后 ， 按 “Enter” 键 。 
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计算 完成 ! 
30 
以 上 未 满 “以 下 ) 次 数 
500 600 599 4 
600 700| 699| 13 
700 800, 799 18 
800 900 899,12 
900 1000 999 3 


Ese ee, pig RES 


选取 单元 格 "B10"。 
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在 "选取 类 别 " 中 选择 "统计 "， 再 从 * 选 取 函 数 "中 选择 "AVERAGE"。 





计算 完成 ! ! 
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与 【步骤 1】 到 【步骤 5】 相同 步骤 ， 求 中 位 数 和 标准 差 。 求 中 位 数 时 ， 利 用 
“MEDIAN" 函 数 ， 求 标准 差 时 ， 则 利用 “STDEVP" 函 数 。 


做 成 “次 数 分 布 表 ”一 部 分 ) 





使 用 61 页 的 资料 。 
选取 单元 格 "F20"。 
= i i 
Ls) 2 首 通 ve s 普通 
fa) 3 he 18 ER 3 Ex 
D 4 普通 19 BK 34， 讨 大 
5 DR 20 x 5 8x 
6 ER a SR 35 ax 
1 ER 2 Sx s 喜欢 
T an zt 
3 24 9 
10. BK. 25 喜欢 s 喜欢 
BR 2 BK 
四 12 ak z jak 
13 ma 2 ER 
14 ER 2 ER 
| as ae m a 
时 
ZR 
sx 
na 
HK 


从 工具 栏 的 “插入 ”中 选取 “函数 ”一 项 。 


在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "COUNTIF"。 
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选取 下 图 的 范围 ， 在 "Crjteria 直接 输入 "喜欢 "， 点 "确定 "按钮 。 





计算 完成 ! 













a 


ELE bbb 
S2esegeese 


SBBRRRLN 


与 【步骤 1】 到 【步骤 5】 相 同步 又 ， 求 "普通 "和 "讨厌 "的 次 数 。 


198 ”附录 运用 EXCEL 计 算 


算出 标准 分 数 、 离 差 
使 用 72 页 的 资料 。 
从 【步骤 1】 到 【步骤 5】 是 标准 分 数 的 相关 程序 。 而 从 【步骤 10】 到 【 步 又 


12】 为 离 差 的 相关 程序 。 
虽然 Excel 中 存在 可 求 出 标准 分 数 的 函数 ， 然 而 并 不 存在 可 求 出 离 差 的 函数 。 但 
是 ， 如 果 利 用 标准 计 分 的 结果 ， 将 能 更 快 求 出 离 差 。 因 此 ， 本 书 使 用 Excel 求 离 差 。 


选取 单元 格 "E2"。 






* 





从 工具 栏 的 "插入 "中 选取 “函数 "一 项 。 


在 "选取 类 别 " 中 选择 "统计 "， 再 从 “选取 函数 "中 选择 "STANDARDIZE"。 
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选取 单元 格 "B2"。 





于 "Mean "中 选择 单元 格 *B20" 后 ， 按 一 次 "F4" 键 ， 并 确认 *B20" 是 否 变 成 
“$B$20"。 
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于 “Standard_dev" 中 选取 "B21" 后 ， 按 一 次 F4" 键 ， 并 确认 “B21" 是 否 变 成 “$B$21” 
后 ， 点 "确定" 按钮。 





确认 是 否 已 求 出 琉 衣 的 标准 分 数 。 






an = 
i a 
a 2 
s £ 
p 2 
63, t 
6 F 
% K3 
T H 
53. g 
190, J 
St x 
s i. 
5, a 
34 3 
m 的 
70 P 
83, 4 
zr ji 
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将 鼠标 移 近 单 元 格 "E2" 的 右 下 角 ， 待 鼠标 变 为 "黑色 十 字 游 标 "后 ， 按 下 鼠标 左 
键 ， 拖 拉 至 "E19" 后 放 开 左 键 。 


s 
im 


reer 


标准 差 计算 完成 ! ! 


| 


“Frererere rr 
4 
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选取 "F2"， 在 单元 格 内 输入 “=E2*10+50"， 然 后 按 下 "Enter" 键 。 





重复 【 步 又 8】 的 操作 。 


离 差 计算 完成 ! ! 


aa 
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算出 标准 正 态 分 布 的 机 率 
使 用 93 页 的 资料 。 


选取 单元 格 "B2"。 


z 1.96 
中 加 经 过 
面积 《= 比价 :机率 


从 工具 栏 的 " 插 和 人 "中选 "函数 "一 项 。 


在 "选取 类 别 "中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "NORMSDIST"。 


选取 单元 格 "B1"， 按 下 "确定 " 键 。 
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其 实 “NORMSDIST” 为 求 出 下 图 机 率 的 函数 。 
在 此 ， 于 单元 格 “B3” 内 输入 “=B2-0.5”。 








计算 完成 ! ! 
算出 卡 方 分 布 的 横 轴 刻度 
使 用 104 页 的 资料 。 
选取 单元 格 "B3"。 
P 0.05 
自由 度 1 
FAAN 


从 工具 栏 的 "插入 "中 选 “函数 "一 项 。 
在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "CHIINV"。 
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选取 单元 格 “B1" 和 单元 格 "B2"， 按 下 “确定 " 键 。 





计算 完成 ! 





4 0. 05| 
— 
,3.8 有 459 
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算出 相关 系数 的 值 
使 用 116 页 的 资料 。 


选取 单元 格 "B14"。 





从 工具 栏 的 "插入 "中 选 " 函 数 "一 项 。 


在 "选取 类 别 "中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "CORREL"。 


选取 下 图 的 范围 后 ， 按 下 "确定 " 键 。 


EZZ SACEM LI cen | 
— 
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计算 完成 ! ! 





独立 性 检验 
使 用 157 的 资料 。 


选取 单元 格 "B8"。 


| “| 打 电 话 Tce | 当面 | 合计 | 
PR 
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于 单元 格 "B8" 内 ， 输 入 "=E2*B4/E4"。 然 后 按 下 "Enter 键 。 
— tnt ae 
RA — 
| Sots sm 
g 


选取 单元 格 *B8" 内 的 "E2" 文 字 部 分 ， 连 按 3 次 *F4" 键 ， 并 确认 *E2" 是 否 变 为 "$E2” 
后 ， 按 下 "Enter" fit, 





选取 单元 格 *B8" 内 的 *B4" 文 字 部 分 ， 连 按 2 次 *F4" 键 。 并 确认 *B4" 是 否 变 为 
“B$4"。 选 取 单元 格 "B8" 内 的 "E4" 文 字 部 分 ， 按 1 次 "F4" 键 ， 确 认 *E4" 是 否 变 为 '$E$4" 
后 ， 按 下 “Enter" 键 。 
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选取 单元 格 "B8"， 将 鼠标 移 近 单元 格 "B8" 的 右 下 角 ， 待 鼠标 变 为 “黑色 十 字 鼠 标 ” 
后 ， 按 下 鼠标 左 键 ， 拖 来 至 "D8" 后 放 开 左 键 。 








从 单元 格 "B8" 选 取 单 元 格 "D8"， 将 鼠标 移 近 单元 格 "D8" 的 右 下 角 ， 待 鼠标 变 为 
“黑色 十 字 鼠 标 "后 ， 按 下 鼠标 左 键 ， 拖 拉 至 单元 格 "D9" 后 放 开 左 键 。 





选取 单元 格 "B12"。 从 工具 列 的 "插入 "中 点 选 “ 函 数 "。 在 "选取 类 别 "中 选择 * 统 
计 "， 再 从 "选取 函数 "中 选择 *CHITEST"。 





附 录 运用 EXCEL 计 算 


选取 下 图 的 范围 ， 按 下 "确定 "按钮 。 











计算 完成 ! ! (※ 请 确认 此 值 是 否 与 177 页 的 P 值 一 致 。) 





—— G E > 
— Se is — 





—— — 
36.48 51. 17333333 64. 34666667 


0, 01823258) 
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